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本 书 是 计算 机 科学 概论 课程 的 经 典 教材 ， 全 书 对 计算 机 科学 做 了 百科 全 书 式 的 精彩 阐述 ， 充 分 展现 
了 计算 机 科学 的 历史 背景 、 发 展 历程 和 新 的 技术 趋势 。 本 书 首先 介绍 的 是 信息 编码 及 计算 机 体系 结构 的 
基本 原理 ， 进 而 介绍 操作 系统 和 组 网 及 因特网 的 相关 内 容 ， 接 着 探讨 算法 、 程 序 设计 语言 及 软件 工程 ， 
然后 讨论 数据 抽象 和 数据 库 方面 的 问题 ， 讲 述 图 形 学 的 主要 应 用 以 及 人 工 智能 ， 最 后 以 计算 理论 的 介绍 
结束 全 书 。 本 书 在 内 容 编排 上 由 具体 到 抽象 逐步 推进 ， 很 适合 教学 安排 ， 每 一 个 主题 自然 而 然 地 引导 出 
下 一 个 主题 。 此 外 ， 书 中 还 包含 大 量 的 图 、 表 和 示例 ， 有 助 于 读者 对 知识 的 了 解 与 把 握 。 

第 12 版 主要 是 将 Python 程序 设计 语言 方面 的 介绍 纳入 了 重点 章节 ， 除 了 增加 与 Python 相关 的 内 
容 ， 儿 乎 每 一 章 都 能 看 到 对 前 一 版 对 应 章节 的 修订 、 更 新 以 及 修正 。 

本 书 非常 适合 作为 高 等 院 校 计算 机 以 及 相关 专业 本 科 生 教材 ， 也 可 以 供 有 意 在 计算 机 方面 发 展 的 
非 计算 机 专业 读者 作为 入 门 参考 。 
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前 


了 中 


本 书 是 计算 机 科学 的 入 门 教材 。 在 力求 保持 学 科 广 度 的 同时 ， 还 兼顾 深度 ， 以 对 所 涉及 的 
主题 给 出 中 肯 的 评价 。 
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读者 对 象 


本 书面 向 计算 机 科学 以 及 其 他 各 个 学 科 的 学 生 。 大 多 数 计算 机 科学 专业 的 学 生 在 最 初 的 学 
习 中 都 有 这 样 一 个 误解 ， 认 为 计算 机 科学 就 是 程序 设计 、 网 页 浏览 以 及 因特网 文件 共享 ， 因 为 
这 基本 上 就 是 他 们 所 看 到 的 一 切 。 实 际 上 计算 机 科学 远 非 如 此 。 在 入 门 阶段 ， 学 生 们 需要 了 解 
他 们 主攻 的 这 门 学 科 所 涉及 内 容 的 广度 ， 这 也 正 是 本 书 的 宗 则 。 本 书 力图 使 学 生 对 计算 机 科 
学 有 一 个 总 体 的 了 解 ， 希望 在 这 个 基础 上 ， 他 们 可 以 领会 该 领域 今后 其 他 课程 的 特点 以 及 相互 
关系 。 事实 上 ， 本 书 采用 的 综述 方式 也 是 自然 科学 入 门 教程 的 常用 模式 。 

其 他 学 科 的 学 生 如 果 想 融入 这 个 技术 化 社会 ， 也 需要 具备 这 些 宽 泛 的 知识 背景 。 适 用 于 他 
们 的 计算 机 科学 课程 提供 的 应 该 是 对 整个 领域 很 实用 的 剖析 ， 而 不 仅仅 是 培训 学 生 如 何 上 网 和 
使 用 一 些 流行 的 软件 。 当 然 ， 这 种 培训 也 有 其 适用 的 地 方 ， 但 本 书 的 目的 不 在 于 此 ， 而 是 用 作 
计算 机 科学 的 教科 书 。 

在 编写 本 书 先前 各 版 时 ， 我 们 力求 保持 其 对 非 技术 类 学 生 的 可 读 性 。 因 此 ， 本 书 已 经 成 功 
地 用 作 教 科 书 ， 读 者 襄 括 了 从 高 中 生 到 研究 生 的 各 个 教育 层次 众多 专业 的 学 生 。 这 一 版 将 保持 
这 一 传统 。 
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第 12 版 新 增 的 内 容 


第 12 版 主要 是 将 Python 程序 设计 语言 方面 的 介绍 纳入 了 重点 章节 。 在 前 几 章 中 ， 对 这 些 
补充 内 容 做 了 选读 标记 。 在 第 5 章 ， 我 们 用 Python 和 Python 风格 的 伪 代 码 替 换 了 先前 版 本 中 类 
似 Pascal 的 表示 法 。 

这 代表 了 本 书 的 一 个 重要 改变 ， 本 书 之 前 一 直 努 力 回避 突出 任何 一 种 特定 语言 。 我 们 做 出 
这 种 改变 的 原因 有 几 人 个。 首先 ， 本 书 已 经 包含 了 相当 多 的 各 种 语言 代码 ， 有 几 章 还 有 详细 的 伪 
代码 。 其 次 ， 读 者 已 经 吸收 了 相当 多 的 句法 方面 的 知识 ， 似 乎 可 以 将 句法 重新 定位 为 在 后 续 课 
程 中 会 实际 看 到 的 语言 。 最 后 ， 更 重要 的 是 ， 越 来 越 多 的 使 用 本 书 的 教师 断定 ， 即 使 是 优先 介绍 
计算 的 广度 ， 对 于 学 生来 讲 ， 如 果 缺 乏 用 于 探索 和 实验 的 编程 工具 ， 许 多 课题 也 会 很 难 掌握 。 

那 为 什么 选择 Python 呢 ? 语言 的 选择 始终 是 一 个 有 争议 的 问题 ， 任 何 一 种 选择 ， 反 对 的 人 
都 至 少 和 支持 的 人 一 样 多 。Python 是 一 个 极 好 的 中 间 选 择 ， 因 为 : 

口 其 句法 简洁 易学 ; 

D 其 IO 原 语 简单 ; 





2 前 言 


D 其 数据 类 型 和 控制 结构 与 先前 版 本 中 使 用 的 伪 代 码 原 语 很 接近 ; 

D 它 文 持 多 个 程序 设计 范式 。 

Python 是 一 门 成 熟 的 程序 设计 语言 ， 它 拥有 充满 活力 的 开发 社区 和 丰富 的 在 线 资源 ， 便 于 进 一 
步 的 研究 。 根 据 某 些 衡 量 标准 ，Python 仍 然 是 业界 10 大 最 常用 的 程序 设计 语言 之 一 ， 并 且 在 计算 机 
科学 入 门 课程 中 的 使 用 急剧 增加 。 对 非 计 算 机 专业 的 学 生来 讲 ， 它 是 一 门 极 其 受 欢迎 的 入 门 课程 ， 
并 且 已 被 其 他 物理 学 和 生物 学 这 样 的 STEM 领域 广泛 接受 ， 作 为 计算 科学 应 用 的 首选 语言 。 

然而 ， 本 书 的 重点 仍然 是 广义 的 计算 机 科学 概念 ， 补 充 Python 语 言 的 内 容 是 为 了 让 读者 能 
会 到 比 先前 版 本 更 浓 的 编程 味 儿 ， 而 不 是 为 了 全 面 地 介绍 编程 。 所 涵盖 的 Python 主题 是 由 本 书 现 
有 的 结构 决定 的 。 因 此 ， 第 1 章 涉 及 的 是 Python 句 法 ， 用 于 表示 数据 一 一 整数 、 浮 点 数 、ASCII 字 
符 串 或 Unicode 字 符 串 ， 等 等 。 第 2 章 涉及 的 是 Python 运算 ， 详 细 地 反映 了 本 章 其 余部 分 所 讨论 的 机 
器 原 语 。 条 件 、 循 环 以 及 函数 是 在 第 5 章 引 入 的 ， 那 里 需要 使 用 这 些 结构 来 设计 一 个 足够 完整 的 描 
述 算法 的 伪 代 码 。 简 而 言 之 ，Python 结 构 是 用 来 进一步 阐明 计算 机 科学 概念 而 不 是 劫持 话题 的 。 

除了 Python 的 内 容 ， 几 乎 每 一 章 都 能 看 到 对 前 一 版 对 应 章节 的 修订 、 更 新 以 及 修正 。 


章节 安排 


本 书 主 题 由 具体 到 抽象 逐步 推进 一 一 这 是 一 种 很 利于 教学 的 顺序 ， 每 一 个 主题 自然 而 然 地 
引导 出 下 一 个 主题 。 首 先 介绍 的 是 信息 编码 、 数 据 存储 及 计算 机 体系 结构 的 基本 原理 〈 第 1 章 和 
第 2 章 ); 进而 是 操作 系统 〈 第 3 章 ) 和 计算 机 网 络 (第 4 章 ); 探讨 了 算法 、 程 序 设计 语言 及 软件 
开发 (第 5 章 至 第 7 章 ); 探索 如 何 更 好 地 访问 信息 《第 8 章 和 第 9 章 ); 考虑 了 计算 机 图 形 学 技术 的 
一 些 重要 应 用 (第 10 章 ) 及 人 工 智 能 〈 第 11 章 )， 最 后 介绍 了 抽象 的 计算 理论 〈 第 12 章 )。 

虽然 本 书 的 编排 顺序 自然 连贯 ， 但 各 个 章节 都 具有 很 强 的 独立 性 ， 可 以 单独 阅读 ， 也 可 以 
根据 不 同学 习 顺 序 重 新 排列 。 事 实 上 ， 本 书 通常 被 用 作 各 类 课程 的 教材 ， 内 容 选 择 的 顺序 是 多 
种 多 样 的 。 其 中 一 种 教 法 是 先 介 绍 第 5 章 和 第 6 章 ( 算 法 和 程序 设计 语言 )， 然后 按照 需要 返回 到 
前 面 的 相应 章节 。 我 还 知道 有 门 课程 是 从 第 12 章 有 关 可 计算 性 的 内 容 开 始 的 。 这 本 书 还 曾 作 为 深 
入 不 同 领 域 项 目的 基础 ， 用 于 “高 级 研讨 班 ” 课 程 的 教科 书 。 对 于 不 需要 了 解 太 多 技术 的 学 生 ， 
教学 中 可 以 重点 讲述 第 4 章 ( 组 网 及 因特网 )、 第 9 章 (数据 库 系 统 )、 第 10 章 (计算 机 图 形 学 ) 
和 第 11 章 (人 工 智 能 )。 

每 章 开篇 都 用 星 号 标 出 了 选 学 章节 。 选 学 章节 要 么 是 讨论 更 专业 的 话题 ， 要 么 是 对 传统 内 
容 作 深 入 探究 。 此 举 仅仅 是 为 那些 想 采 取 不 同 阅 读 顺序 的 人 提供 一 点 建议 。 当 然 ， 还 有 其 他 读 
法 。 尤 其 对 于 那些 寻求 快速 阅读 的 读者 ， 我 们 建议 采取 下 面 的 阅读 顺序 。 
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章 节 主 题 
1.1~1.4 数据 编码 和 存储 基础 
2.1~2.3 机 器 体系 结构 和 机 器 语言 
3.1 一 3.3 操作 系统 

4.1 一 4.3 组 网 及 因特网 

5.1 一 5.4 算法 和 算法 设计 

6.1 一 6.4 程序 设计 语言 

7.1 一 7.2 软件 工程 





@ STEM 是 4 个 英语 单词 Science (科学 )、Technology (技术 )、Engineering (工程 ) 和 Mathematics( 数 学) 的 
缩写 。 一 一 译 者 注 


续 表 
章 节 主 题 
8.1 一 8.3 数据 抽象 
9.1 一 9.2 数据 库 系统 
10.1 一 10.2 计算 机 图 形 学 
11.1 一 11.3 人 工 智 能 
12.1~12.2 计算 理论 


在 本 书 中 有 几 条 贯穿 始终 的 主线 。 主 线 之 一 是 计算 机 科学 是 不 断 发 展 变化 的 。 本 书 从 历史 
发 展 的 角度 反复 呈现 各 个 主题 ， 讨 论 其 当前 的 状况 ， 并 指出 研究 方向 。 另 一 条 主线 是 抽象 的 作 
用 以 及 用 抽象 工具 控制 复杂 性 的 方式 。 该 主线 在 第 0 章 引 入 , 然后 在 操作 系统 、 体 系 结构 、 组 网 、 
算法 的 发 展 、 程 序 设 计 语 言 设计 、 软 件 工程 、 数 据 组 织 和 计算 机 图 形 学 等 内 容 中 反复 体现 。 


致 教师 


本 教材 所 包含 的 内 容 很 难 在 一 个 学 期 内 讲授 完 ， 因 此 一 定 要 果断 砍 掉 不 适合 自己 教学 目标 
的 那些 主题 ， 或 者 根据 需要 重新 调整 讲授 顺序 。 你 会 发 现 ， 尽 管 本 书 有 它 固 有 的 结构 体系 ， 但 
各 个 主题 在 很 大 程度 上 是 相对 独立 的 ， 完 全 可 以 根据 需要 作出 选择 。 我 写本 书 的 目的 是 把 它 作 
为 一 种 课程 的 资源 ， 而 非 课程 的 定义 。 我 们 建议 鼓励 学 生 自 己 阅 读 课堂 上 没有 讲授 的 内 容 。 如 
果 我 们 认为 所 有 的 东西 都 一 定 要 在 课堂 上 讲 ， 那 就 低估 学 生 的 能 力 了 。 我 们 应 该 教会 他 们 独立 
学 习 。 

关于 本 书 从 具体 到 抽象 的 组 织 结构 ， 我 们 觉得 有 必要 多 言 几 句 。 作 为 学 者 ， 我 们 总 以 为 学 
生 会 欣赏 我 们 对 于 学 科 的 观点 ， 这 些 观点 通常 是 我 们 在 某 一 领域 多 年 工作 中 形成 的 。 但 作为 教 
师 ， 我 们 认为 最 好 从 学 生 的 视角 呈现 教材 。 这 就 是 为 什么 本 书 首先 介绍 数据 的 表示 /存储 、 计 算 
机 体系 结构 、 操 作 系统 以 及 组 网 ， 因 为 这 些 都 是 学 生 们 最 容易 产生 共鸣 的 主题 : 他 们 很 可 能 听 
说 过 JPEG、MP3 这 些 术语 ; 可 能 用 CD 和 DVD 刻录 过 资料 ， 买 过 计算 机 配件 ， 应 用 过 某 一 操作 
系统 ; 上 过 因特网 。 从 这 些 主题 开始 讲授 这 门 课程 ， 学 生 可 以 为 许多 让 他 们 困惑 多 年 的 问题 找 
到 答案 ， 并 且 把 这 门 课 看 成 是 实践 课程 而 不 是 纯 理 论 的 课程 。 由 此 出 发 ， 就 会 很 自然 地 过 渡 到 
较 抽 象 的 算法 、 算 法 结构 、 程 序 设 计 语 言 、 软 件 开 发 方法 、 可 计算 性 以 及 复杂 性 等 内 容 上 ， 而 
这 些 内 容 就 是 我 们 本 领域 的 人 认为 的 计算 机 科学 的 主要 内 容 。 正 如 前 面 所 说 的 ， 以 这 种 方式 呈 
现 全 书 并 不 是 强求 大 家 都 按 此 顺序 讲课 ， 只 是 鼓励 大 家 如 此 尝试 一 下 。 

我 们 都 知道 ， 学 生 能 学 到 的 东西 要 远 远 多 于 我 们 直接 传授 的 内 容 ， 而 且 潜移默化 传授 的 知 
识 更 容易 被 吸收 。 当 要 “传授 ”问题 的 解决 方法 时 ， 就 更 是 如 此 。 学 生 不 可 能 通过 学 习 问 题 求 
解 的 方法 变 成 问题 的 解决 者 ， 他 们 只 有 通过 解决 问题 ， 而 且 不 仅仅 是 解决 那些 精心 设计 过 的 “教科 
书 式 的 问题 ” 才能 成 为 问题 的 解决 者 。 因 此 ， 本 书 加 入 了 大 量 的 问题 ， 并 特意 让 其 中 一 些 问 题 模 
棱 两 可 一 一 这 意味 着 正确 方法 或 正确 答案 不 一 定 是 唯一 的 。 我 们 鼓励 大 家 采用 并 拓展 这 些 问 题 。 

“潜移默化 学 习 ” 类 的 其 他 话题 还 有 职业 精神 、 道 德 和 社会 责任 感 。 我 认为 这 种 内 容 不 应 该 
独立 成 章 ， 而 是 应 该 在 有 所 涉及 时 讨论 ， 而 这 正 是 本 书 的 编排 方法 。 你 会 发 现 ，3.5 节 、4.5 节 、 
7.9 节 、9.7 节 和 11.7 节 分 别 在 操作 系统 、 组 网 、 软 件 工程 、 数 据 库 系统 和 人 工 智能 的 上 下 文中 提 
及 了 安全 、 隐 私 、 责 任 和 社会 意识 的 问题 。 你 还 会 发 现 ， 每 一 章 都 包含 了 一 些 社会 问题 ， 这 些 
问题 将 鼓励 学 生 思 考 他 们 所 生活 的 现实 社会 与 教材 中 的 内 容 的 关系 。 

感谢 你 对 本 书 感 兴趣 。 无 论 你 是 否 选用 本 书 作为 教材 ， 我 都 希望 你 认同 它 是 一 部 好 的 计算 
机 科学 教育 文献 。 
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教学 特色 


本 书 是 多 年 教学 经 验 的 结晶 ， 因 此 在 辅助 教学 方面 考虑 较 多 。 最 主要 的 是 提供 了 丰富 的 问题 以 
加 强 学 生 的 参与 一 一 这 一 版 包含 1 000 多 个 问题 ， 分 为 “问题 与 练习 ”“ 复 习题 ”和 “社会 问题 ”。 

“问题 与 练习 ” 列 在 每 节 末 尾 〈 除 了 第 0 章 外 )， 用 于 复习 刚刚 讨论 过 的 内 容 ， 扩 充 以 前 讨论 
过 的 知识 ， 或 者 提示 以 后 会 涉及 的 有 关 主 题 。 这 些 问题 与 练习 的 答案 可 在 网 上 下 载 。 

“复习 题 ” 列 在 每 章 的 末尾 《〈 第 0 章 除 外 )。 它 们 是 课 后 作业 ， 内 容 町 盖 整 章 ， 书 中 没有 给 出 
答案 。 

“社会 问题 ”也 列 在 每 章 的 末尾 ， 供 思考 讨论 。 许 多 问题 可 以 用 来 开展 课外 研究 ， 可 要 求学 
生 提 交 简 短 的 书面 或 口头 报告 。 

在 每 章 的 末尾 还 设 有 “课外 阅读 ”， 它 列 出 了 与 本 章 主题 有 关 的 参考 资料 。 同 时 ， 前 言 以 及 
正文 中 所 列 的 网 址 也 非常 适合 用 于 查找 相关 资料 。 
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补充 材料 


本 书 的 许多 补充 材料 可 以 从 配套 网 站 www.pearsonhighered.com/brookshear 上 找到 。 
以 下 内 容 面 向 所 有 读者 。 

口 每 章 的 实践 项 目 帮助 读者 加 深 理 解 本 教材 的 主题 ， 并 可 以 帮助 读者 了 解 其 他 相关 主题 。 

oO 每 章 的 “ 自 测 题 ”帮助 读者 复习 本 书 中 的 内 容 。 

口 介绍 Java 和 C++ 基 本 原理 的 手册 ， 它 在 教学 顺序 上 与 本 书 是 兼容 的 。 

除 此 之 外 , 教师 还 可 以 登录 Pearson Education 的 教师 资源 中 心 (www.pearsonhighered.com) 
网 站 申请 获得 下 面 的 教 辅 资料 。 

口 包含 “复习 题 ”答案 的 教师 指南 。 

口 PowerPoint 幻 灯 片 讲稿 。 

oO 测试 题库 。 

本 书 的 勘误 表 (如 果 有 的 话 ) 网 址 为 www.mscs.mu.edu/~brylow/errata/。 


致 学 生 


Glenn Brookshear 有 一 点 点 偏执 〈 他 的 一 些 朋 友 说 可 远 不 是 一 点 点 )， 所 以 写本 书 时 ， 他 很 少 
接受 他 人 的 建议 ， 许 多 人 认为 其 中 一 些 内 容 对 于 初学 者 过 于 高 深 。 但 是 ， 我 们 相信 即使 学 术 界 
把 它们 归 为 “高 级 论题 ” 但 只 要 与 主题 相关 就 是 合适 的 。 读 者 需要 的 是 一 本 全 面 介 绍 计 算 机 科 
学 的 教科 书 ， 而 不 是 “缩水 ”的 版 本 一 一 只 包括 那些 简化 了 的 、 被 认为 适合 初学 者 的 主题 。 因 
此 ， 我 们 不 回避 任何 主题 ， 而 是 力求 寻找 更 好 的 解释 。 我 们 力图 在 一 定 深 度 上 向 读者 展示 计算 
机 科学 最 真实 的 一 面 。 就 好 比 对 待 菜 谱 里 的 那些 调味 品 一 样 ， 你 可 以 有 选择 地 略 过 本 书 的 一 些 
主题 ， 但 我 们 全 部 呈现 出 来 是 为 了 在 你 想 要 的 时 候 供 你 “品尝 ”而 且 我 们 也 鼓励 你 们 去 尝试 。 

我 们 还 要 指出 的 是 ， 在 任何 与 技术 有 关 的 课程 中 ， 当 前 学 到 的 详细 知识 未 必 就 适合 以 后 的 
需要 。 这 个 领域 是 发 展 变化 的 一 一 这 正 是 使 人 兴奋 的 方面 。 本 书 将 从 现实 及 历史 的 角度 展现 本 
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GD “问题 与 练习 答案 ”可 以 从 异步 社区 (www.epubit.com.cn) 本 书 网 页 免费 注册 下 载 。 一 一 编者 注 


前 言 5 





学 科 的 内 容 。 有 了 这 些 背景 知识 ， 你 就 会 和 技术 一 起 成 长 。 我 们 希望 你 现在 就 开始 行动 起 来 ， 
不 要 局 限于 课本 的 内 容 ， 而 要 进行 大 胆 探索 。 要 学 会 学 习 。 

感谢 你 的 信任 ， 选 择 了 我 们 的 这 本 书 。 作 为 作者 ， 我 们 有 责任 创作 出 值得 一 读 的 作品 。 我 
们 希望 你 觉得 我 们 已 经 尽 到 了 这 份 责 任 。 
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致谢 


首先 ， 我 要 感谢 Glenn Brookshear， 他 一 直 照 看 着 这 本 书 一 一 “他 的 孩子 ” 包括 之 前 的 
11 个 版 本 ， 跨 越 了 计算 机 科学 领域 快速 发 展 和 动荡 变化 的 超过 四 分 之 一 个 世纪 的 时 间 。 虽 然 这 
是 他 头 一 版 允许 合 著者 来 审查 所 有 的 修订 ， 但 这 一 版 收录 的 仍然 基本 是 Glenn 的 “声音 ”， 并 由 
他 主导 ， 这 也 是 我 所 希望 的 。 任 何 新 的 瑕 疫 都 是 我 造成 的 ， 而 优雅 的 基本 框架 都 是 他 设计 的 。 

我 和 Glenn 要 感谢 那些 支持 本 书 〈 阅 读 并 使 用 本 书 前 几 个 版 本 ) 的 人 们 ， 我 们 感到 很 荣幸 。 

在 DavidT Smith (宾夕法尼亚 州 印第安 纳 大 学 ) 和 我 共同 编写 第 11 版 修订 的 过 程 中 ，David 
发 挥 了 很 重要 的 作用 。 他 做 的 许多 修订 在 第 12 版 中 仍然 存在 。David 对 本 版 的 仔细 阅读 和 对 补充 
材料 的 仔细 关注 对 本 书 来 讲 至 关 重 要 。Andrew Kuemmel (Madison West)、George Corliss 
(Marquette) 和 Chris Mayfield (James Madison) 为 本 版 本 的 初稿 提供 了 有 价值 的 反馈 、 深 刻 的 
见解 和 /或 鼓励 ， 同 时 James E. Ames (Virginia Commonwealth)、Stephanie E. August (Loyola)、 
Yoonsuck Choe (Texas A&M)、 Melanie Feinberg (UT-Austin), Eric D. Hanley (Drake)、 Sudharsan 
R. Iyengar (Winona State)、Ravi Mukkamala (Old Dominion) 和 Edward Pryor (Wake Forest) 对 
Python 方 面 的 修订 提供 了 宝贵 的 评价 。 

其 他 对 这 一 版 和 之 前 版 本 作出 贡献 的 人 包括 J. M. Adams、C. M. Allen、D. C. S. Allison、E. 
Angel、R. Ashmore、B. Auernheimer、P. Bankston、M. Barnard、P Bender\ K. Bowyer、P. W. Brashear、 
C. M. Brown、 H. M. Brown、B. Calloni、 J. Carpinelli、 M. Clancy、R. 工 Close、D. H. Cooley、 
L. D. Cornell、 M. J. Crowley、 F. Deek、 M. Dickerson、 M.J. Duncan, S$. Ezekiel、 C. Fox、 S. Fox、 
N. E. Gibbs、 J.D. Harris、D. Hascom、 L. Heath、 P. B. Henderson、 L. Hunt、 M. Hutchenreuther、 
L.A. Jehn\ K. K. Kolberg\ K. Korb\ G. Krenz\ J. Kurose\J. Liu\ T.J.Long\C. May、J. J. McConnell、 
W. McCown, S.J. Merrill\ K. Messersmith\ J. C. Moyer、 M. Murphy、 J. P. Myers,\ Jr., D. S$. Noonan、 
G Nutt、W. W. Oblitey、S. Olariu、G. Riccardi、G. Rice、 N. Rickert、 C. Riedesel、 J. B. Rogers、 
G. Saito、W. Savitch、 R. Schlafly、 J.C. Schlimmer、 S. Sells、Z. Shen、 G. Sheppard、 J.C. Simms、 
M. C. Slattery、 J. Slimick、 J. A. Slomka、 J. Solderitsch、R. Steigerwald、L. Steinberg、 C. A. Struble、 
C.L. Struble、W. J. Taffe、 .J. Talburt、P. Tonellato、P. Tromovitch、 P. H. Winston、E. D. Winter、 
E. Wright、M. Ziegler， 还 有 一 位 匿名 的 朋友 。 我 们 向 他 们 中 的 每 一 位 致 以 最 真诚 的 谢意 。 

如 前 所 述 ， 本 书 的 配套 网 站 上 有 Java 和 C++ 手册 来 讲述 这 两 种 语言 的 基础 知识 ， 与 本 书 的 
内 容 相得益彰 。 它 们 是 由 Diane Christie 撰 写 的 , 在 此 表示 感谢 。 另 外 ,还 要 感谢 Roger Eastman， 
他 是 本 书 配套 网 站 上 每 章 实践 项 目的 出 题 人 。 

我 同时 要 感谢 支持 本 项 目的 Pearson 出 版 集团 的 员工 。 特 别 是 ， 和 Tracy Johnson、Camille 
Trentacoste、Carole Snyder 一 起 工作 特别 愉快 , 他 们 为 本 书 贡献 了 自己 的 智慧 , 提供 了 许多 改进 。 

最 后 ， 我 要 感谢 我 的 妻子 Petra “the Rock”， 这 本 书 是 专门 献 给 她 的 。 她 的 耐心 和 煞 力 
往往 超出 了 我 ， 这 本 书 因 她 的 稳定 影响 而 更 好 了 。 











尊敬 的 老师 ; 

您 好 ! 

为 了 确保 您 及 时 有 效 地 申请 培 生 整 体 教学 资源 ， 请 您 务必 完整 填写 如 下 表格 ， 加 盖 学 院 的 
公章 后 传真 给 我 们 ， 我 们 将 会 在 2-3 个 工作 日 内 为 您 处 理 。 

请 填写 所 需 教 辅 的 开课 信息 : 






口 本 科 1/2 年 级 


口 研究 生 口 本 科 3/4 年 级 
















| | 
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办 公 电 子 邮 箱 〈 必 填 ) 
(如 XXXGQruc.edu.cn) 


系 / 院 主任 : (签字 ) 
( 系 / 院 办 公 室 章 ) 
= 机 
资源 介绍 
-教材 、 常 规 教 辅 (PPT、 教 师 手 册 、 题库 等 ) 资源 : 请 访问 www.pearsonhighered.com/educator。 
(免费 ) 


-MyLabs/Mastering 系 列 在 线 平台 : 适合 老师 和 学 生 共同 使 用 ， 访 问 需要 Access Code。 〈 付 费 ) 


100013 ”北京 市 东城 区 北三 环 东 路 36 号 环球 贸易 中 心 D 座 1208 室 
电话 : (8610)57355086 传真 : (8610)58257961 


器 季 步 什 区 


人 人民 邮电 出 版 社 
El www,epubif,com,cn 


欢迎 来 到 异步 社区 ! 


异步 社区 的 来 历 


异步 社区 (www.epubit.com.cn) 是 人 Te 
民 邮 电 出 版 社 旗下 IT 专业 图 书 旗舰 社区 ， 
于 2015 年 8 月 上 线 运营 。 

异步 社区 依托 于 人 民 邮 电 出 版 社 20 
余年 的 IT 专业 优质 出 版 资源 和 编辑 策划 
团队 ， 打 造 传统 出 版 与 电子 出 版 和 自 出 版 
结合 、 纸 质 书 与 电子 书 结合 、 传 统 印刷 与 
POD 按 需 印刷 结合 的 出 版 平台 ， 提 供 最 
新 技术 资讯 ， 为 作者 和 读者 打造 交流 互动 
的 平台 。 














国 一 " 
社区 里 都 有 什么 ? 
购买 图 书 


我 们 出 版 的 图 书 涵盖 主流 IT 技术 ， 在 编程 语言 、Web 技术 、 数 据 科 学 等 领域 有 众多 经 典 畅 销 图 书 。 
社区 现 已 上 线 图 书 1000 余 种 ， 电 子 书 400 多 种 ， 部 分 新 书 实现 纸 书 、 电 子 书 同步 出 版 。 我 们 还 会 定期 
发 布 新 书 书 讯 。 





社区 内 提供 随 书 附 赠 的 资源 ， 如 书 中 的 案例 或 程序 源 代码 。 
另外 ， 社 区 还 提供 了 大 量 的 免费 电子 书 ， 只 要 注册 成 为 社区 用 户 就 可 以 免费 下 载 。 


习作 详 者 互动 

很 多 图 书 的 作 译 者 已 经 入 驻 社区 ,您 可 以 关注 他 们 ， 咨 询 技 术 问 题 ， 可 以 阅读 不 断 更 新 的 技术 文章 ， 
听 作 译 者 和 编辑 畅 聊 好 书 背 后 有 趣 的 故事 ; 还 可 以 参与 社区 的 作者 访谈 栏目 ， 向 您 关注 的 作者 提出 采访 
题目 。 


灵活 优惠 的 购书 


您 可 以 方便 地 下 单 购买 纸 质 图 书 或 电子 图 书 ， 纸 质 图 书 直接 从 人 民 邮 电 出 版 社 书库 发 货 ， 电 子 书 提 
供 多 种 阅读 格式 。 

对 于 重 磅 新 书 ， 社 区 提供 预 售 和 新 书 首发 服务 ， 用 户 可 以 第 一 时 间 买 到 心仪 的 新 书 。 

用 户 帐户 中 的 积分 可 以 用 于 购书 优惠 。100 积分 =1 元， 购买 图 书 时 ,在 : 上 里 填 
入 可 使 用 的 积分 数值 ， 即 可 扣 减 相应 金额 。 


特别 优惠 


购买 本 书 的 读者 专 享 异步 社区 购书 优惠 券 。 
S4XC5 基于 强 ， 然 后 点 击 “ 使 


使 用 方法 : 注册 成 为 社区 用 户 ， 在 下 单 购书 时 输入 
用 优惠 码 ”， 即 可 在 原 折 扣 基 础 上 享受 全 单 9 折 优惠 。( 订 单 满 39 元 即 可 使 用 ， 本 优惠 券 只 可 使 


用 一 次 ) 








纸 电 图 书 组 合 购买 
社区 独家 提供 纸 质 图 书 和 电子 书 组 合 
购买 方式 ， 价 格 优惠 ， 一 次 购买 ， 多 种 阅 


读 选择 ， 
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社区 里 还 可 以 做 什么 ? 
您 可 以 在 图 书页 面 下 方 提交 勘误 ， 每 条 勘误 被 确认 后 可 以 获得 100 积分 。 热 心 勘误 的 读者 还 有 机 会 


参与 书稿 的 审 校 和 翻译 工作 。 

写作 

社区 提供 基于 Markdown 的 写作 环境 ， 喜 欢 写作 的 您 可 以 在 此 一 试 身手 ， 在 社区 里 分 享 您 的 技术 心 
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绪 论 


开篇 的 这 一 章 ， 我 们 探讨 计算 机 科学 所 涉及 的 领域 ， 介 绍 其 历史 背景 ， 然 后 为 我 们 


士 的 深入 学 习 疯 定 基础 。 

本 章 内 容 

0.1 算法 的 作用 a nn 学 习 大 网 1 
0.2 计算 机 器 的 由 来 cho 计算机 种 学 的 首要 主题 


计算 机 科学 这 门 学 科 ， 是 要 为 计算 机 设计 、 计 算 机 程序 设计 、 信 息 处 理 、 问 题 的 算法 解决 
方案 和 算法 过 程 本 身 等 主题 建立 科学 的 基础 。 计 算 机 科学 既是 当今 计算 机 应 用 的 支柱 ， 又 是 今 
后 计算 基础 设施 的 基础 。 

本 书 将 详细 介绍 计算 机 科学 ， 探 索 广阔 的 主题 ， 包 括 构成 大 学 计算 机 科学 课程 的 大 部 分 主 
题 。 我 们 要 领略 这 个 领域 的 博大 精深 和 变化 发 展 。 因 此 ， 除 了 这 些 主题 本 身 ， 我 们 还 关注 它们 
的 历史 发 展 、 现 今 的 研究 动态 以 及 今后 的 前 景 。 我 们 的 目标 是 让 人 们 以 学 以 致 用 的 态度 来 对 待 


类 项 纵 三 











步 的 社会 加 露 头角 。 


0.1 ”算法 的 作用 


首先 让 我 们 了 解 一 下 计算 机 科学 最 基础 的 概念 “算法 ”。 一 般 来 讲 ， 算 法 (algorithm) 
是 完成 一 项 任务 所 遵循 的 一 系列 步 又。( 在 第 5 章 ， 我 们 将 给 出 比较 精确 的 定义 。) 例如 ， 有 关于 
训 饪 的 算法 〈 称 为 菜谱 )， 有 在 陌生 城市 准确 定位 的 算法 〈 通 常 称 为 道路 指南 )， 有 使 用 洗衣 机 
的 算法 〈 通 常 标示 在 洗衣 机 盖子 的 内 侧 或 者 贴 在 自助 洗衣 店 的 墙 上 )， 有 演奏 音乐 的 算法 〈 以 乐 
谱 的 形式 表示 )， 还 有 订 术 表演 的 算法 〈 见 图 0-1 )。 

在 一 台 机 器 (如 计算 机 )〉 执行 一 项 任务 之 前 ， 必 须 先 找到 完成 这 项 任务 的 算法 ， 并 且 用 与 
该 机 器 兼容 的 形式 表示 出 来 。 某 一 个 算法 的 表示 称 作 一 个 程序 (program)。 为 了 人 们 读 写 方便 ， 
计算 机 程序 通常 打印 在 纸 上 或 者 显示 在 计算 机 屏幕 上 。 为 了 便于 机 器 识别 ， 程 序 需要 采取 一 种 
与 该 机 器 技术 兼容 的 形式 进行 编码 。 开 发 程序 、 采 取 与 机 器 兼容 的 形式 进行 编码 并 将 其 输入 到 
机 器 中 的 过 程 ， 称 作 程 序 设 计 〈programming)。 程 序 及 其 所 表示 的 算法 总 称 为 软件 (software )， 
而 机 器 设备 本 身 则 称 为 硬件 (hardware )。 








2 第 0 章 绪 论 


效果 : 表演 者 从 一 副 普通 的 扑克 牌 中 抽取 若干 张 牌 ， 正 面 朝 下 放 在 桌 上 ， 充 分 洗 牌 后 展开 。 然 后 ， 表 演 者 
会 根据 观众 的 要 求 相 应 地 翻 出 红牌 或 者 黑 牌 。 


秘诀 : 

步骤 1 从 一 副 普通 扑克 牌 中 抽取 10 张 红牌 和 10 张 黑 牌 。 把 它们 根据 颜色 分 为 两 操 , 正面 朝 上 放 在 桌面 上 。 

步骤 2 ”告诉 观众 你 已 经 选取 了 若干 张 红 牌 和 黑 牌 。 

步骤 3 拿 起 红牌 ， 装 作 整 理 成 一 操 的 样子 ， 将 它们 正面 朝 下 放 在 左手 里 ， 同 时 用 右手 的 拇指 和 食指 挤 压 这 
摆 牌 的 两 端 ， 把 牌 面 向 下 推 ， 使 得 每 张 牌 呈现 略微 向 下 的 弧 形 。 然 后 ， 把 这 摆 红 牌 扣 在 桌子 上 并 
宣布 :“ 这 是 其 中 的 红牌 。” 

步骤 4 拿 起 黑 牌 ， 模仿 步骤 3 的 方法 , 但 要 使 这 些 牌 呈现 略微 向 上 的 弧 形 。 然后, 把 牌 扣 在 桌子 上 并 宣布 : 


“这 是 其 中 的 黑 牌 。” 
步骤 5 ”把 黑 牌 放 回 桌面 后 ， 立 即 用 双手 把 红牌 和 黑 牌 混在 一 起 仍然 正面 朝 下 )， 平 铺 在 桌面 上 。 告 诉 大 
家 你 已 经 洗 好 了 牌 。 
步骤 6 只 要 桌面 上 还 有 扣 着 的 牌 ， 就 重复 下 面 的 步骤 : 
-1 请 观众 要 一 张 红 牌 或 黑 牌 。 
如 果 所 要 的 牌 为 红色 ， 而 且 桌 面 上 倒 扣 有 思 形 的 牌 ， 就 翻 开 其 中 的 一 张 并 告诉 大 家 :“ 这 
是 一 张 红 牌 ”。 
如 果 所 要 的 牌 为 黑色 ， 而 且 桌 面 上 倒 扣 有 同形 的 牌 ， 就 翻 开 其 中 的 一 张 并 告诉 大 家 :“ 这 
是 一 张 黑 牌 ”。 
否则 ， 就 告诉 大 家 桌面 上 没有 所 要 求 颜色 的 牌 了 ， 然 后 翻 开课 面 上 所 有 的 牌 ， 以 证 实 你 的 断言 。 





图 0-1 一 个 魔术 的 算法 


算法 的 研究 起 源 于 数学 学 科 。 事 实 也 的 确 如 此 ， 它 是 数学 家 的 重要 活动 ， 远 远 早 于 当今 
计算 机 的 出 现 。 它 的 目标 是 找 出 一 组 指令 ， 描 述 如 何 解决 某 一 特定 类 型 的 所 有 问题 。 求 解 
两 个 多 位 数 商 的 长 除 算法 (long division algorithm ) 是 早期 研究 中 一 个 最 著名 的 例子 。 另 一 
个 例子 是 古 希 腊 数学 家 欧 几 里 得 发 现 的 欧 几 里 得 算法 一 一 求 两 个 正 整数 的 最 大 公约 数 〈 见 
图 0-2 )。 


描述 : 本 算法 假定 输入 是 两 个 正 整数 ， 目 的 是 要 计算 这 两 个 数 的 最 大 公约 数 。 


过 程 : 
步骤 1 将 这 两 个 数 中 较 大 的 一 个 和 较 小 的 一 个 分 别 赋予 M 和 N。 


步骤 2 用 M 除 以 YN， 余数 设 为 R。 
步骤 3 如 果 R 不 为 0， 那 么 将 N 的 值 赋予 M， 并 将 R 的 值 赋予 W， 然 后 回 到 步骤 2， 和 否则 最 大 公约 数 就 是 N 
当前 被 赋予 的 值 。 





图 0-2 求 两 个 正 整数 的 最 大 公约 数 的 欧 几 里 得 算法 


一 旦 我 们 找到 了 执行 一 个 任务 的 算法 ， 那 么 在 执行 该 任务 时 ， 就 不 再 需要 了 解 该 算法 所 依 
据 的 原理 一 一 任务 的 执行 演变 成 了 遵照 指令 操作 的 过 程 。( 我 们 可 以 根据 长 除 算法 求 商 , 或 者 根 
据 欧 几 里 得 算法 求 得 最 大 公约 数 ， 不 需要 了 解 算 法 的 工作 原理 。) 在 某 种 意义 上 ,解决 这 个 问题 
的 智能 被 编码 到 算法 中 。 

通过 算法 来 捕获 和 传达 智能 〈 至 少 是 智能 行为 )， 我 们 能 够 设计 出 执行 有 用 任务 的 机 器 。 因 
此 ， 机 器 的 智能 级 别 受 限 于 算法 所 传达 的 智能 。 只 有 存在 执行 某 一 项 任务 的 算法 时 ， 我 们 才 可 
以 制造 出 执行 这 一 任务 的 机 器 。 换 言 之 ， 如 果 我 们 找 不 到 解决 某 问 题 的 算法 ， 机 器 就 解决 不 了 
这 个 问题 。 

20 世 纪 30 年 代 ， 库 尔 特 。 哥 德尔 (Kurt G6del) 发 表 了 不 完备 性 定理 的 论文 ， 它 使 确定 算法 
能 力 的 局 限 性 成 为 数学 的 一 个 研究 课题 。 这 个 定理 的 主旨 就 是 ， 在 任何 一 个 包括 传统 意义 的 算 





0.2 计算 机 器 的 由 来 3 


术 系统 的 数学 理论 内 ， 总 有 一 些 命题 的 真 伪 无 法 通过 算法 的 手段 来 确定 。 简 言 之 ， 对 于 我 们 算 
术 系 统 的 任何 全 面 研究 都 超越 了 算法 活动 的 能 力 。 这 一 认识 动 播 了 数学 的 基础 ， 于 是 关于 算法 
能 力 的 研究 随 之 而 来 ， 它 开创 了 今天 计算 机 科学 这 门 学 科 。 的 确 ， 正 是 算法 的 研究 构成 了 计算 
机 科学 的 核心 。 


Oy 


今天 的 计算 机 有 着 庞大 久远 的 世系 渊源 ， 其 中 较 早 的 一 个 计算 设备 是 算盘 。 历史 告 诉 我 们 ， 
它 可 能 源 于 中 国 证 代 且 曾 被 用 于 早期 希腊 和 罗马 文明 。 算 盘 本 身 非 常 简单 ， 一 个 矩形 框 里 固定 
着 一 组 小 棍 ， 而 每 个 小 棍 上 又 各 串 有 一 组 珠子 〈 见 图 0-3)。 在 小 棍 上 ， 珠 子 上 下 移动 的 位 置 就 
表示 所 存储 的 值 。 正 是 这 些 珠子 的 位 置 代 表 了 这 台 “ 计 算 机 ”所 表示 和 存储 的 数据 。 这 台 机 器 
是 依靠 人 的 操作 来 控制 算法 执行 的 。 因 此 ， 算 盘 自 身 只 算得 上 一 个 数据 存储 系统 ， 它 必须 在 人 
的 配合 下 才能 成 为 一 台 完 整 的 计算 机 器 。 











图 0-3 中国 木 制 算 盘 (Pink Badger/Fotolia) 


从 中 世纪 到 近代 ， 人 们 开始 探求 更 复杂 的 计算 机 器 。 一 些 发 明 人 开始 基于 齿轮 技术 设计 计 
算 机 器 。 采 用 这 种 技术 的 发 明 家 有 法 国 的 布 菜 斯 。 帕 斯 卡尔 〈Blaise Pascal，1623 一 1662)、 德 国 的 
戈 特 弗 里 德 。 威 廉 。 莱 布 尼 茨 〈Gottfried Wilhelm Leibniz，1646 一 1716) 和 英国 的 查尔斯 。 巴 
贝 奇 〈Charles Babbage，1792 一 1871) 等 。 这 些 机 器 利用 齿轮 的 位 置 来 表示 数据 ， 要 在 规定 具 
轮 初始 位 置 的 基础 上 机 械 地 输入 数据 。 帕 斯 卡尔 和 莱 布 尼 茨 的 机 器 所 计算 的 结果 是 通过 观察 齿 
轮 的 最 终 位 置 得 到 的 。 而 巴 贝 奇 构想 的 机 器 ， 则 可 以 把 计算 的 结果 打印 在 纸 上 ， 从 而 消除 可 能 
出 现 的 抄写 错误 。 

就 执行 算法 的 能 力 而 言 ， 我 们 可 以 看 到 这 些 机 器 在 灵活 性 上 的 进步 。 帕 斯 卡尔 的 机 器 只 是 
为 了 执行 加 法 而 设计 ， 因 此 必须 将 正确 的 步骤 序列 嵌入 到 机 器 结构 本 身 。 同 样 ， 莱 布 尼 茨 的 机 
器 也 把 算法 能 入 了 其 机 器 结构 中 ， 但 它 提 供 了 多 种 算术 运算 供 操作 员 选 择 。 巴 贝 奇 设计 的 差分 
机 (Difference Engine) 仅 造 了 一 个 演示 模型 ， 可 以 通过 修改 执行 各 种 计算 ， 但 他 设计 的 分 析 机 
(Analytical Engine)《〈 从 未 得 到 过 建设 资助 ) 则 能 够 在 纸 卡片 上 读 取 以 洞 孔 形式 表示 的 指令 。 所 
以 ， 巴 贝 奇 的 分 析 机 是 可 编程 的 。 事 实 上 ， 奥 古 斯 塔 。 艾 达 。 拜 伦 (Augusta Ada Byron， 通 称 
Ada Lovelace) 经 常 被 认为 是 世界 上 第 一 位 程序 员 ,， 她 曾 发 表 过 一 篇 论文 ,阐述 巴 贝 奇 的 分 析 机 
是 如 何 通过 编程 实现 各 种 计算 的 。 





人 ， 巴 贝 奇 的 差分 机 av 
查尔斯 。 巴 贝 奇 设计 的 这 人 台 由 本 而 确 是 现代 讶 第 机 设计 的 拓 服 。 如 果 能 用 比较 经 济 的 
技术 制造 出 这 台 机 器 ， 如 果 当 时 商业 和 政府 数据 处 理 需 求 达 到 今天 的 规模 ， 那 么 巴 贝 奇 的 思 
想 可 能 在 19 世 纪 就 引发 了 计算 机 革命 。 事 实 上 ， 他 在 有 生 之 年 只 造 出 了 差分 机 的 演示 模型 。 
该 机 器 通过 计算 “逐次 差分 ”来 确定 数字 值 。 我 们 可 以 通过 考虑 整数 平方 的 计算 问题 ， 深 入 
了 解 这 一 技术 。 我 们 先 从 基础 知识 开始 ，0 的 平方 是 0，1 的 平方 是 1，2 的 平方 是 4，3 的 平方 是 
9. 据 此 ， 可 以 按照 下 面 的 方法 得 到 4 的 平方 ( 见 下 图 )。 现在， 我 们 来 计算 一 下 已 知 平方 之 
闻 的 差 : 12202=1 2 12 一 3，3=22=5。 然 后 我 们 计算 这 些 结果 的 差 : 3=1=2, 5=3= 
2。 注 意 看 ,这 些 差 都 是 2。 假 设 这 个 规律 能 够 成 立 ( 数学 上 可 以 证 明 它 是 成 立 的 )， 那么 我 们 
可 以 得 出 这 样 的 结论 : (42-32) 和 (3-2 如 ) 之 间 的 差 也 一 定 是 2。 因 为 (人 -37) 比 (3-2?) 
大 2， 所 以 42- 32= 7， 作 = 3247= 16。 现在， 我 们 已 经 知道 了 4 的 平方 ， 那 么 就 可 以 依据 1、 
2?、32 和 四 的 值 继 续 计算 5 的 平方 。 (虽然 更 深入 地 讨论 逐次 差分 已 经 超出 了 本 书 范围 , 但 是 学 
过 微 积分 的 学 生 可 能 已 观察 到 ， 前 面 的 例子 是 基于 “y =x 的 二 阶 导数 是 一 条 直线 ”这 个 实事 


得 出 的 。) 








奥 古 斯 塔 ， 艾 达 。 拜 伦 ( 洛 夫 莱 斯 伯 苗 夫人 ) 是 计算 界 关 注 的 焦点 人 物 。 艾 达 。 和 拜 伦 的 
一 生 近 乎 悲惨 ， 去 世 时 还 不 到 37 岁 (1815 一 1852 )。 她 体弱多病 ， 身 处 限制 妇女 从 业 的 社会 ， 
是 个 不 墨守成规 的 人 人。 尽管 她 对 很 多 科学 都 感 兴趣 ， 但 最 感 兴趣 的 还 是 数学 。1833 年 ， 目 睹 
了 查尔斯 。 巴 贝 奇 的 差分 机 样机 演示 后 ， 她 就 被 这 台 机 器 迷 住 了 ， 从 此 对 “计算 科学 ”产生 
了 兴趣 ， 好 把 一 篇 讨论 巴 贝 奇 分 析 机 设计 的 论文 从 法 文 翻译 为 英文 ， 算 是 她 最 早 对 计算 机 科 
学 做 出 的 贡献 。 巴 贝 奇 还 鼓励 她 在 翻译 中 增加 一 个 附录 ， 介 绍 该 机 器 的 应 用 ,以 及 该 机 器 如 
何 编程 实现 各 种 任务 的 示例 。 巴 贝 奇 对 艾 达 。 拜 伦 的 工作 十 分 热情 ， 他 和 希望 论文 的 出 版 可 以 
帮 他 得 到 资金 援助 ， 建 造 他 的 分 析 机 。( 作为 拜 伦 勋 器 的 女儿 ， 艾 达 。 和 拜 伦 具有 名 人 的 地 位 ， 
在 生意 场 上 也 有 一 定 的 关系 。) 虽然 巴 贝 夺 最 终 没 有 得 到 资金 援助 ， 但 是 艾 达 。 拜 伦 的 附录 保 
存 了 下 来 ， 人 们 认为 该 附录 包含 了 第 一 批 计算 机 程序 的 例子 。 关 于 巴 贝 奇 对 艾 达 的 工作 影响 
有 多 大 ， 研 究 计 算 机 历史 的 学 者 们 一 直 争论 不 体 。 有些 历 史学 家 认为 ， 巴 贝 奇 作出 了 重大 贡 
献 ， 但 另外 一 些 人 则 认为 ， 巴 贝 奇 并 没有 帮 到 艾 达 ， 从 很 大 程度 上 来 看 反而 是 一 种 阻碍 。 无 
论 如 何 ， 奥 十 斯 塔 。 艾 达 。 和 拜 伦 都 被 认为 是 世界 上 第 一 位 计算 机 程序 员 ， 美 国 国防 部 为 了 纪 
念 这 位 伟大 的 女性 ， 用 她 的 名 字 命 名 了 一 种 程序 设计 语言 (Ada )。 
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通过 纸 卡片 上 的 洞 孔 来 传达 算法 的 思想 并 不 是 源 于 巴 贝 奇 。 他 是 从 约瑟夫 。 雅 卡尔 〈Joseph 
Jacquard，1752 一 1834) 那里 得 到 这 个 想法 的 。 约 瑟 夫 。 雅 卡尔 于 1801 年 研制 出 一 种 织 布 机 ， 
它 在 织 布 过 程 中 执行 的 步骤 ， 是 由 宽大 厚实 的 木 制 〈 或 纸板 ) 卡片 上 的 洞 孔 样式 决定 的 。 因 此 ， 
织 布 机 的 算法 很 容易 进行 修改 ， 可 以 得 出 不 同 的 编织 设计 。 另 一 个 受益 于 雅 卡 尔 思 想 的 人 是 赫 
尔 曼 。 霍 尔 瑞 斯 (Herman Hollerith，1860 一 1929)， 他 灵活 运用 这 一 概念 一 一 用 纸 卡片 上 洞 孔 的 
样式 来 表示 信息 ， 加 速 了 美国 1890 年 人 口 普查 中 的 表格 处 理 。( 霍 尔 瑞 斯 的 这 项 改造 促成 了 IBM 
的 诞生 。 ) 这 种 卡片 最 终 被 称 作 穿孔 卡片 , 直到 20 世 纪 70 年 代 , 它 仍 是 与 计算 机 交互 的 流行 工具 。 
从 成 本 效益 上 来 讲 ，19 世 纪 的 技术 无 法 让 由 斯 卡尔、 莱 布 尼 菊 和 巴 贝 奇 设计 的 复杂 齿轮 驱 
动机 器 付 诸 生产 。 但 是 ， 随 着 20 世 纪 初 期 电子 技术 的 进步 ， 人 们 克服 了 这 个 障碍 。 这 种 进步 的 
例子 包括 ， 乔 治 ， 斯 带 比 兹 (George Stibitz) 的 电子 机 械 机 器 和 马克 一 号 (Mark 1); 前 者 由 
贝尔 实验 室 于 1940 年 建造 ， 后 者 由 霍华德 。 艾 肯 (Howard Aiken) 和 一 组 IBM 工 程 师 于 1944 
年 在 哈佛 大 学 建造 。 这 些 机 器 大 量 使 用 了 电子 控制 的 机 械 式 继电器 。 从 这 个 意义 上 说 ， 这 些 
机 器 几乎 是 刚 造 出 来 就 过 时 了 ， 因 为 其 他 研究 人 员 已 在 应 用 电子 管 技 术 建 造 完 全 电子 化 的 计 
算 机 。 第 一 台 真 空 管 机 器 显然 是 阿 塔 纳 索 夫 - 贝 瑞 (Atanasoff-Berry) 机 器 ， 由 约 输 。， 阿 塔 纳 
索 夫 (John Atanasoff) 和 他 的 助手 克利 福 德 。 贝 里 (Clifford Berry)， 于 1937 一 1941 年 ， 在 艾 奥 
瓦 州立 学 院 (现在 的 艾 奥 瓦 州立 大 学 ) 建造 。 
一 台 是 称 为 巨人 (Colossus) 的 机 器 ， 在 汤 
米 。 弗 劳 尔 斯 CTommy Flowers) 的 指导 下 
建造 于 英国 , 该 机 器 在 第 二 次 世界 大 战 后 期 
曾 被 用 来 破解 德国 的 情报 。( 实 际 上 ， 这 类 
机 器 有 十 余 台 ， 但 是 由 于 军 方 的 保密 和 国家 安 
全 问题 而 未 能 列 入 “计算 机 家 谱 ”。) 不 入， 更 
为 灵活 的 机 器 出 现 了 ， 如 电子 数字 积分 器 和 
计算 器 (Electronic Numerical Integrator And 
Calculator，ENIAC),， 它 是 由 约 朝 。 莫 奇 利 (John 
Mauchly) 和 羡 雷 斯 波 ， 埃 克 特 (J.Presper ”一 
Eckert) 在 宾夕法尼亚 大 学 莫 尔 电子 工程 学 院 ”图 0-4 三 个 女人 在 操作 莫 尔 学 院 的 ENIAC 主 控制 板 。 





(照片 由 美国 陆军 提供 ) 
从 那 时 起 ， 计 算 机 器 的 发 展 史 就 开始 和 最 三 自 关 国 导 于 扣 人 
技术 进步 紧 紧 相连 ， 包 括 晶体 管 的 发 明 (物理 学 家 威廉 。 肖 克利 、 约 输 ， 巴 丁 和 沃尔特 。 布 拉 


顿 因 此 获得 了 诺 贝 尔 奖 ) 和 后 来 集成 电路 的 开发 〈 杰 克 。 基 尔 比 因此 荣获 了 诺 贝 尔 物理 学 奖 )。 
由 于 这 些 技术 ， 以 往 20 世 纪 40 年 代 房 间 大 小 的 机 器 在 数 十 年 间 缩 小 到 了 单机 柜 大 小 。 与 此 同时 ， 
计算 机 器 的 处 理 能 力 每 两 年 便 会 翻 倍 (这 一 趋势 一 直 持 续 到 了 今天 )。 随 着 集成 电路 技术 的 进步 ， 
计算 机 中 的 许多 部 件 都 可 封装 在 玩具 大 小 的 塑料 块 中 做 成 芯片 ， 放 到 电子 市 场 上 销售 。 

计算 机 的 普及 在 很 大 程度 上 得 益 于 台式 计算 机 的 发 展 。 人 台式 计算 机 的 出 现 是 计算 机 爱好 者 
的 功劳 ， 他 们 通过 芯片 组 合 构建 了 家 用 计算 机 。 正 是 在 这 些 计算 机 爱好 者 的 “地 下 ”活动 中 ， 
史 蒂 夫 。 乔 布 斯 (Steve Jobs) 和 斯 蒂 芬 。 沃 效 尼 亚 克 〈Stephen Wozniak) 两 个 人 制造 出 了 有 商 
业 价 值 的 家 用 计算 机 ， 并 于 1976 年 成 立 了 苹果 计算 机 公司 ( 现 称 人 苹果 公司 )， 专门 制造 和 销售 他 
们 的 产品 。 其 他 经 销 类 似 产品 的 公司 有 Commodore、Heathkit 和 Radio Shack。 虽 然 这 些 产 品 在 计 
算 机 爱好 者 中 很 畅销 ， 但 是 并 没有 被 商业 界 普遍 接受 。 面 对 大 量 的 计算 需要 ， 这 些 商 家 仍然 青 
睐 于 著名 的 IBM 公 司 及 其 大 型 计算 机 。 

1981 年 ，IBM 公 司 推出 了 它 的 第 一 款 人 台式 计算 机 ， 称 为 个 人 计算 机 ， 简 称 PC， 其 基础 软件 
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由 一 个 称 为 微软 (Microsoft〉 的 年 轻 公 司 开发 。PC 一 经 推出 立即 获得 了 极 大 的 成 功 ， 并 且 黄 定 
了 这 种 台式 计算 机 在 商界 人 士 心目 中 作为 日 用 品 的 地 位 。 今 天 ， 术 语 PC 已 被 广泛 用 于 指称 整个 
这 一 类 机 器 (来 自 各 个 不 同 厂 商 )， 其 设计 都 是 从 IBM 公 司 最 初 的 台式 计算 机 演变 而 来 的 ， 而 且 
它们 大 多 数 继续 与 微软 公司 的 软件 一 起 销售 。 不 过 ， 有 了 时候， 术语 PC 也 能 与 通用 术语 台式 机 或 
笔记 本 电脑 互 换 使 用 。 

在 20 世 纪 后 期 ， 因 特 网 〈Internet) 的 出 现 大 大 改变 了 人 们 的 沟通 方式 ， 这 种 技术 将 个 人 计 
算 机 连 成 了 一 个 全 球 系统 。 在 这 个 背景 下 ， 蒂 姆 。 伯 纳 斯 。 李 (Tim Berners-Lee) 是 英国 的 一 
位 科学 家 ， 他 提出 了 一 个 系统 ， 这 个 系统 可 以 通过 因特网 把 计算 机 上 存储 的 文档 链接 起 来 形成 
错综复杂 的 链接 信息 网 ， 这 便 是 万 维 网 (World Wide Web )， 简 称 Web。 为 了 能 够 访问 Web 信 息 ， 
人 们 开发 了 一 种 叫 作 搜索 引擎 (search engine) 的 软件 系统 ,筛选 Web 上 的 信息 ,对 结果 进行 “ 归 
类 ”， 然 后 通过 搜索 结果 帮助 用 户 研究 特定 内 容 。 这 一 领域 的 主要 参与 者 有 谷歌 、 雅 虎 和 微软 。 
这 些 公司 不 断 扩展 其 与 Web 相 关 的 活动 ， 而 且 经 常会 挑战 我 们 的 传统 思维 方式 。 





谷歌 公司 创 : .于 1998 征 ， 已 经 成 为 世界 上 最 受 认可 的 一 家 技术 公司 ， 现在 ， 数 亿 人 使 用 





谷歌 提供 了 电子 邮件 服务 
eT ee ep 
地 图 、 Google 日 历 。 Google 地 球 、 Google 图 书 和 Google 翻 译 )。 

然而; 谷歌 除了 极 具 创 业 精神 以 外 ， 还 为 不 断 发 展 的 科技 如 何 挑战 现代 社会 做 出 了 榜样 。 
例如 ， 谷歌 的 搜索 引 擎 带 来 的 问题 是 ， 一 个 国 际 化 公司 应 该 在 何 种 程度 上 遵守 各 个 政府 的 意愿 ; 
YouTube 带 来 的 问题 是 ， 一 个 公司 对 于 他 人 利用 其 服务 分 发 的 信息 应 负 何 种 程度 的 责任 ; Google 
图 书 引起 了 人 们 对 于 知识 产权 的 适用 范围 和 局 限 性 的 关注 ; Google 地 图 则 被 指责 侵犯 了 隐私 权 。 


与 此 同时 ， 人 台式 计算 机 和 笔记 本 电脑 正在 被 人 们 所 接受 ， 并 用 于 家 庭 ， 计 算 机 器 的 微型 化 
仍 在 继续 。 今 天 ， 大 量 的 电子 装置 和 设备 中 都 代 有 微型 计算 机 。 现 在 的 汽车 可 能 就 包含 了 几 十 
个 小 计算 机 ， 用 于 运行 全 球 定 位 系统 〈Global Positioning System，GPS )， 监 控 发 动机 的 功能 

并 提供 控制 汽车 音频 和 电话 通信 系统 的 语音 命令 服务 。 

也 许 ， 计 算 机 微型 化 最 革命 性 的 应 用 就 是 智能 手机 〈smartphone) 能 力 的 扩展 。 智 能 手机 
是 小 型 手持 通用 计算 机 ， 通 话 应 用 仅 是 其 众多 应 用 之 一 。 从 功能 上 讲 ， 这 种 钱包 大 小 的 设备 比 几 
十 年 前 的 超级 计算 机 还 要 强大 ， 它 配备 有 大 量 传感器 和 接口 ， 包 括 照 相机 、 话 简 、 指 南 针 、 触 摸 
屏 、 加 速 计 (用 以 检测 手机 的 方向 和 动作 )， 以 及 一 系列 无 线 技术 (以 便 与 其 他 智能 手机 和 计算 
机 通信 )。 很 多 人 认为 智能 手机 对 全 球 社会 的 影响 大 于 PC 革命 。 
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0.3 学 习 大 纲 


本 书 遵循 自 底 向 上 的 方法 讲述 计算 机 科学 ， 先 从 读者 有 杀身 体验 的 主题 开始 《如 计算 机 便 
件 )， 继 而 引出 比较 抽象 的 主题 (如 算法 复杂 性 和 可 计算 性 )。 结果 是 ， 我 们 的 学 习 遵循 了 这 样 
一 个 模式 ， 随 着 我 们 对 主题 理解 的 深入 ， 我 们 构建 的 抽象 工具 会 越 来 越 大 。 

我 们 首先 学 习 与 设计 和 构造 执行 算法 的 机 器 有 关 的 主题 。 第 1 章 (数据 存储 ) 学 习 现 代 计 算 
机 的 信息 编码 和 信息 存储 问题 ， 第 2 章 〈 数 据 操作 ) 研究 简单 计算 机 的 内 部 基本 操作 。 虽 然 部 分 
学 习 内 容 涉 及 技术 问题 ， 但 总 体 上 是 独立 于 具体 技术 的 。 也 就 是 说 ， 像 数字 电路 设计 、 数 据 编 
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码 与 压缩 系统 ， 以 及 计算 机 体系 结构 这 样 的 主题 ， 与 很 多 技术 都 相关 ， 并 且 不 管 未 来 技术 的 发 
展 方 向 如 何 ， 它 们 的 相关 性 都 不 会 变 。 

第 3 章 ( 操 作 系 统 ) 将 学 习 控 制 一 台 计 算 机 总 体操 作 的 软件 ， 这 种 软件 称 为 操作 系统 。 操 作 
系统 控制 机 器 与 其 外 部 世界 之 间 的 接口 : 保护 机 器 及 其 内 部 存储 数据 不 被 非 授 权 用 户 访问 ， 允 
许 计算 机 用 户 请 求 执行 各 种 程序 ， 协 调 内 部 活动 ， 以 满足 用 户 请 求 。 

第 4 章 (组 网 及 因特网 ) 将 学 习 计算 机 是 如 何 连 接 成 计算 机 网 络 的 ， 网 络 又 是 如 何 连接 成 互 
联网 的 。 这 些 知 识 涉及 到 很 多 主题 ， 如 网 络 协议 、 因 特 网 结构 和 内 部 操作 、 万 维 网 ， 以 及 诸多 
的 安全 问题 。 

第 5 章 (算法 ) 比较 正式 地 介绍 了 算法 。 我 们 要 研究 算法 的 发 现 ， 明 确 几 种 基本 的 算法 结构 ， 
开发 几 项 表示 算法 的 初等 技术 ， 并 介绍 算法 的 有 效 性 和 正确 性 问题 。 

第 6 章 (程序 设计 语言 ) 研究 的 问题 是 算法 表示 和 程序 开发 过 程 。 在 这 一 章 中 , 我 们 会 发 现 ， 
人 们 在 不 断 改 善 程序 设计 技术 的 过 程 中 ， 创 造 出 了 各 种 各 样 的 程序 设计 方法 学 或 范式 ， 而 每 一 
种 都 有 自己 的 一 套 程序 设计 语言 。 我 们 将 研究 这 些 范式 和 语言 ， 以 及 语法 和 语言 翻译 的 问题 。 

第 7 章 〈 软 件 工程 ) 将 介绍 计算 机 科学 的 一 个 分 支 一 一 软件 工程 。 软 件 工 程 处 理 的 是 开发 大 
型 软件 系统 时 所 遇 到 的 问题 。 大 型 软件 系统 的 设计 是 一 项 复杂 的 任务 ， 会 遇 到 传统 工程 未 涉及 
的 许多 问题 。 因 此 ， 软 件 工程 这 一 学 科 已 经 成 为 计算 机 科学 中 一 个 重要 的 研究 领域 ， 它 借鉴 了 
诸如 工程 、 项 目 管理 、 人 事 管理 、 程 序 设 计 语 言 设 计 ， 甚 至 是 建筑 学 等 众多 领域 的 研究 经 验 。 

在 接 下 来 的 两 章 中 ， 我 们 将 学 习 在 计算 机 系统 中 组 织 数据 的 方法 。 第 8 章 〈 数 据 抽象 ) 介绍 
传统 上 用 于 在 计算 机 主 存储 器 中 组 织 数据 的 技术 ， 然 后 探索 数据 抽象 的 演变 发 展 ， 从 原 语 的 概 
念 一 直到 今天 的 面向 对 象 式 技术 。 第 9 章 (数据 库 系 统 ) 介绍 传统 上 用 于 在 计算 机 海量 存储 器 中 
组 织 数 据 的 方法 ， 并 研究 如 何 实现 非常 大 的 复杂 数据 库 系 统 。 

第 10 章 (计算 机 图 形 学 ) 将 研究 图 形 和 动画 ， 这 是 一 个 创建 并 图 像 化 虚拟 世界 的 领域 。 在 
计算 机 科学 传统 领域 (如 机 器 体系 结构 、 算 法 设计 、 数 据 结构 和 软件 工程 ) 发 展 的 基础 上 ， 图 
形 和 动画 学 科 取 得 了 显著 进展 ， 业 已 发 展 成 为 激动 人 心 、 充 满 活 力 的 学 科 。 此 外 ， 这 个 领域 说 
明了 ,计算 机 科学 的 各 个 组 成 部 分 ， 是 如 何 与 物理 、 艺 术 和 摄影 等 学 科 相 结合 产生 显著 成 果 的 。 

在 第 11 章 〈 人 工 智能 ) 中 ， 我 们 将 了 解 到 ,- 为 了 开发 更 有 用 的 机 器 ， 计 算 机 科学 现 已 一 马 
当先 ， 转 向 研究 人 类 智能 。 研 究 人 员 希 望 通过 对 我 们 自己 的 思维 推理 和 认 知 的 了 解 ， 设 计 出 模 
拟 这 些 过 程 的 算法 ， 从 而 把 这 些 比较 的 能 力 传递 给 机 器 。 结 果 ， 计 算 机 科学 就 有 了 这 个 称 为 人 
工 智 能 的 领域 ， 它 非常 依赖 于 心理 学 、 生 物 学 和 语言 学 等 领域 的 研究 。 

我 们 的 学 习 到 第 12 章 (计算 理论 ) 结束 ， 这 一 章 将 介绍 计算 机 科学 的 理论 基础 ， 这 个 主题 
会 让 我 们 了 解 到 算法 〈 和 机 器 ) 的 局 限 性 。 在 本 章 ， 我 们 不 但 明确 了 几 个 算法 上 不 能 解决 的 问 
题 (它们 在 理论 上 也 是 超出 机 器 能 力 的 ), 而 且 认识 到 许多 其 他 问题 的 解决 都 需要 大 量 的 时 间或 
空间 ， 以 致 从 实践 的 角度 上 讲 也 是 不 可 解 的 。 因 此 ， 通 过 本 章 的 学 习 ， 我 们 将 能 够 掌握 算法 系 
统 的 应 用 范围 和 局 限 性 。 

我 们 的 目标 是 ， 每 一 章 主题 的 探讨 都 足够 深入 ， 使 读者 真正 理解 。 我 们 希望 所 阐述 的 计算 
机 科学 知识 对 大 家 的 工作 能 有 所 帮助 一 一 使 读者 了 解 自己 所 生活 的 技术 社会 ， 打 好 跟随 科技 进 
步 自我 学 习 的 基础 。 


EN 


0.4 ”计算 机 科学 的 首要 主题 - 


除了 上 面 列 出 的 每 一 章 的 主题 之 外 ， 我 们 希望 通过 对 以 下 儿 个 首要 主题 的 探讨 ， 拓 宽 读者 
对 计算 机 科学 的 理解 。 


oR EE a rr ter 





8 第 0 章 绪 论 


计算 机 的 微型 化 及 其 功能 的 扩展 ， 已 经 把 计算 机 技术 推 向 了 当今 社会 的 最 前 治 。 如 今 ， 计 
算 机 技术 已 经 非常 普及 ， 熟 练 掌握 其 应 用 已 经 成 为 现代 社会 成 员 的 基本 要 求 。 计 算 机 技术 已 经 
改变 了 政府 施加 控制 的 能 力 ， 对 全 球 化 经 济 产生 了 巨大 的 影响 ， 导 致 科 学 研究 领域 出 现 了 一 些 
令 人 瞩目 的 成 就 ， 革 新 了 数据 收集 、 存 储 和 应 用 的 作用 ， 为 人 们 提供 了 新 的 通信 和 交互 方式 ， 
不 停 地 挑战 着 社会 现状 。 结 果 是 ， 围 绕 着 计算 机 科学 的 学 科大 量 涌现 ， 每 门 学 科 现 在 都 成 了 重 
要 的 研究 领域 。 此 外 ， 就 像 很 难 区 分 机 械 工程 和 物理 一 样 ， 我 们 也 很 难 在 这 些 领域 与 计算 机 科 
学 之 间 画 出 一 条 分 界线 。 因 此 ， 为 了 获得 合适 的 视角 ， 我 们 的 研究 不 仅 要 涉及 以 计算 机 科学 为 
核心 的 中 心 主题 ， 而 且 还 将 探索 与 科学 应 用 和 影响 相关 的 各 种 学 科 领 域 。 因 此 ， 对 计算 机 科学 的 
介绍 是 跨 学 科 的 。 

探索 计算 领域 的 广度 , 能 帮助 我 们 记 住 那些 主要 的 与 计算 机 科学 相 结合 的 主题 。 虽 然 “ 计 
算 机 科学 的 七 大 思想 ”(Seven Big Ideas of Computer Science) “的 编纂 晚 于 本 书 的 第 10 版 ， 但 
这 些 思想 与 本 书 接 下 来 的 各 章 所 要 讲述 的 主题 思想 有 很 多 相似 之 处 。 这 “七 大 思想 ”简单 地 
说 就 是 : 算法 、 抽 象 、 创 新 、 数 据 、 程 序 设计 、 因 特 网 和 影响 。 在 接 下 来 的 章节 中 ， 我 们 将 
介绍 各 种 主题 ， 在 每 一 种 主题 的 介绍 中 ， 都 会 涉及 这 个 主题 的 核心 思想 、 目 前 的 研究 领域 ， 
以 及 推动 该 领域 知识 进步 的 一 些 技术 。 当 我 们 在 后 面 一 遍 又 一 遍地 提 到 这 些 “ 大 思想 ”的 时 
候 ， 请 多 留意 。 


0.4.1 算法 


数据 存储 容量 有 限 ， 程 序 设计 过 程 复 杂 耗 时 ， 这 些 限 制 了 早期 计算 机 器 所 能 处 理 的 算法 的 
复杂 性 。 如 今 ， 随 着 这 些 局 限 性 的 消除 ， 机 器 能 完成 的 任务 越 来 越 大 、 越 来 越 复杂 。 人 们 试图 
用 算法 表达 这 些 任 务 ， 但 单 任 人 类 的 智力 无 法 做 到 ， 于 是 ， 越 来 越 多 的 研究 工作 转向 了 算法 和 
程序 设计 过 程 的 研究 。 

正 是 在 这 种 背景 下 ， 数 学 家 的 理论 研究 开始 有 了 回报 。 由 于 哥 德 尔 不 完备 性 定理 ， 数 学 家 
已 经 在 研究 有 关 算 法 过 程 的 问题 了 ， 而 这 正 是 先进 技术 目前 面临 的 问题 。 由 此 ， 孕 育 出 了 被 称 
作 计 算 机 科学 的 这 门 学 科 。 

如 今 ， 计 算 机 科学 已 经 黄 定 了 它 算 法 科学 的 地 位 。 这 门 科 学 范围 很 广 ， 涉 及 数学 、 工 程 学 、 
心理 学 、 生 物 学 、 商 业 管理 和 语言 学 等 多 个 学 科 。 事 实 上 ， 研 究 计 算 机 科学 不 同 分 支 的 研究 人 
员 对 计算 机 科学 的 定义 也 许 会 截然 不 同 。 例 如 ， 计 算 机 体系 结构 领域 中 的 研究 人 员 ， 主 要 关注 
微型 电路 技术 ， 因 此 他 们 将 计算 机 科学 视 为 技术 的 进步 和 应 用 ， 但 数据 库 系 统领 域 的 研究 人 员 
则 认为 ， 计 算 机 科学 就 是 要 寻求 方法 来 提升 信息 系统 的 有 用 性 ， 而 人 工 智能 领域 的 研究 人 员 则 
把 计算 机 科学 视 为 智能 和 智能 行为 的 研究 。 

尽管 如 此 ， 所 有 这 些 研究 人 员 的 工作 还 是 都 涉及 了 算法 科学 的 方方面面 。 鉴 于 算法 在 计算 
机 科学 中 扮演 的 核心 角色 ( 见 图 0-5)， 找 出 焦点 问题 ， 对 学 习 算 法 会 非常 有 益 。 

D 算法 过 程 可 以 解决 哪些 问题 ? 

D 怎样 才能 比较 容易 地 发 现 算法 ? 

Q 如 何 改进 表示 和 传达 算法 的 技术 ? 

9 如 何 分 析 和 比较 不 同 算法 的 特征 ? 

Q 如 何 使 用 算法 来 操作 信息 ? 

D 如 何 应 用 算法 来 产生 智能 行为 ? 

9 算法 的 应 用 对 社会 有 何 种 影响 ? 
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算法 的 局 眼 性 


算法 的 应 用 


算法 的 分 析 





算法 的 发 现 外 法 的 表示 
图 0-5 “算法 在 计算 机 科学 中 的 核心 地 位 
0.4.2 ”抽象 


术语 抽象 (abstraction) 在 本 书 中 是 指 一 个 实体 的 外 部 特征 与 其 内 部 构成 细节 之 间 的 分 离 。 
抽象 使 我 们 可 以 忽略 一 些 复杂 设备 (如 计算 机 、 汽 车 和 微波 炉 〉 的 内 部 细节 ， 把 它们 当 作 一 个 
单个 的 、 可 理解 的 单元 使 用 。 此 外 ， 正 是 通过 抽象 ， 这 些 复杂 的 系统 才能 够 被 设计 和 生产 出 来 。 
计算 机 、 汽 车 和 微波 炉 都 是 由 若干 部 件 构成 的 ， 其 中 每 一 个 部 件 表 示 一 层 抽象 ， 在 此 层面 上 ， 
该 部 件 的 使 用 是 独立 于 这 个 部 件 的 内 部 构成 细节 的 。 

运用 抽象 ， 我 们 能 够 构造 、 分 析 和 管理 大 型 的 复杂 计算 机 系统 ， 但 如 果 从 细节 的 层面 上 看 
问题 ， 就 会 不 识 庐 山 真面目 。 在 每 一 个 抽象 层面 上 ， 我 们 都 把 此 系统 看 成 是 由 若干 称 为 抽象 工具 
《abstract tool) 的 部 件 组 成 ， 而 忽略 这 些 部 件 的 内 部 构成 。 这 样 我 们 的 精力 就 集中 了 ， 可 以 考虑 一 
个 部 件 如 何 与 同一 层面 其 他 部 件 发 生 作 用 ， 以 及 这 些 部 件 如 何 作为 一 个 整体 构成 更 高 级 别 的 部 件 。 
由 此 ， 我 们 就 可 以 理解 该 系统 中 与 手头 任务 有 关 的 那 部 分 ， 而 不 会 在 众多 的 细节 中 迷失 方向 。 

需要 强调 的 是 ， 抽 象 并 不 局 限于 科学 和 技术 领域 。 它 是 一 门 重要 的 简化 技术 ， 我 们 的 社会 
形成 的 任何 一 种 生活 方式 都 离 不 开 抽象 。 很 少 有 人 知道 ， 日 常生 活 中 各 种 各 样 的 便利 是 怎样 实 
现 的 : 我 们 需要 吃饭 穿 衣 ， 但 我 们 自己 无 法 生产 ; 我 们 使 用 电器 设备 和 通信 系统 ， 但 不 了 解 它 
们 的 内 部 技术 ; 我 们 享受 其 他 人 提供 的 服务 ， 但 不 知道 他 们 的 专业 细节 。 对 每 一 项 新 的 发 展 ， 
只 有 一 小 部 分 社会 成 员 专职 于 其 实现 ， 其 他 人 则 将 实现 的 结果 作为 抽象 工具 来 使 用 。 这 样 ， 社 
会 的 抽象 工具 仓库 扩大 了 ， 社 会 进一步 发 展 的 能 力也 增强 了 。 

抽象 这 一 话题 在 本 书 中 会 被 反复 提 及 。 我 们 将 了 解 到 ， 计 算 设 备 是 通过 各 种 抽象 工具 构建 
的 。 我 们 还 会 看 到 ， 大 型 软件 系统 的 开发 是 以 模块 化 的 方式 完成 的 ， 其 中 每 个 模块 都 是 较 大 模 
块 中 的 一 种 抽象 工具 。 此 外 ， 在 计算 机 科学 本 身 的 发 展 中 ， 抽 象 也 扮演 了 很 重要 的 角色 ， 有 了 
它 ， 研 究 人 员 可 以 把 精力 集中 在 一 个 复杂 领域 中 的 特定 范围 上 。 实 际 上 ， 本 书 的 编排 也 反映 了 
该 科学 的 这 种 特征 ， 每 一 章 都 围绕 着 计算 机 科学 的 一 个 特定 的 方面 ， 而 且 往 往 出 人 意料 地 完全 
独立 于 其 他 各 章 ， 但 所 有 这 些 章 合 在 一 起 ， 又 形成 了 这 一 巨大 研究 领域 的 全 面 介绍 。 


0.4.3 创新 
虽然 计算 机 可 能 只 是 复杂 的 机 器 ， 机 械 地 执行 着 机 械 式 算法 指令 ， 但 是 我 们 应 该 看 到 ， 计 


算 机 科学 领域 是 一 个 创造 性 的 领域 。 发 现 并 应 用 新 算法 是 人 类 的 一 项 活动 ， 这 项 活动 取决 于 我 
们 天 生 的 用 工具 解决 我 们 周围 世界 中 的 问题 的 欲望 。 计 算 机 科学 不 仅 扩展 了 表示 形式 ， 使 其 跨 
越 了 视觉 、 语 言 和 音乐 艺术 ， 而 且 还 让 新 的 数字 表示 模式 遍及 了 现代 世界 。 

创建 大 型 软件 系统 ， 不 太 像 照 菜谱 做 菜 ， 更 像 是 设想 一 个 宏大 的 新 雕塑 。 构 想 有 雕塑 的 形式 
和 功能 需要 仔细 的 规划 。 制 造 它 的 组 件 需要 时 间 、 对 细节 的 关注 以 及 熟练 的 技能 。 最 终 的 产品 
体现 了 设计 美学 及 其 创造 者 的 情感 。 


0.4.4 数据 


计算 机 能 表示 任何 可 以 被 离散 化 或 数字 化 的 信息 。 算 法 可 以 用 各 种 令 人 眼花 综 乱 的 方式 ， 
处 理 或 转换 这 种 数字 表示 信息 。 因 此 , 算法 不 仅 能 将 计算 机 的 一 部 分 数字 数据 与 另 一 部 分 混 洗 ; 
还 能 让 我 们 搜索 模式 、 创 造 模拟 ， 以 产生 新 知识 和 新 见解 的 方式 来 关联 连接 。 海 量 存储 容量 、 
高 速 计算 机 网 络 以 及 强大 的 计算 工具 ， 推 动 着 科学 、 工 程 和 人 文 领域 中 许多 其 他 学 科 的 发 现 。 
无 论 是 通过 模拟 复杂 蛋白 质 折 车 来 预测 一 种 新 药 的 治疗 效果 ， 统 计 分 析 横 跨 数 百年 的 数字 化 图 
书 的 语言 的 演化 ， 还 是 演 染 通过 非 入 侵 式 医学 扫描 获得 的 三 维 内 脏 图 像 ， 数 据 都 在 驱动 着 现代 
发 现 超越 人 类 自身 的 能 | 

在 本 书 中 ， 我 们 会 探讨 一 些 有 关 数 据 的 问题 ， 具 体 如 下 。 

Q 计算 机 是 如 何 存储 那些 与 常见 的 数字 大 工 制品 有 关 的 数据 〈 如 数字 、 文 本 、 图 像 、 声 音 

和 视频 ) 的 ? 

0 计算 机 是 如 何 粗略 估计 那些 现实 世界 中 模拟 人 工 制品 的 数据 的 ? 

oO 计算 机 是 如 何 检测 和 避免 数据 中 的 错误 的 ? 

口 我 们 现在 所 掌控 的 这 个 由 日 益 增长 的 、 互 连 的 数据 构成 的 数字 宇 害 ， 最 后 会 变 成 什么 样子 ? 


0.4.5 程序 设计 


尽管 现在 产生 的 大 量 的 可 用 语言 和 工具 ， 与 20 世 纪 5$0 年 代 及 20 世 纪 60 年 代 早 期 的 可 编程 计 
算 机 ， 没 什么 相似 之 处 ， 但 是 将 人 类 的 意图 翻译 成 可 执行 的 计算 机 算法 的 这 种 行为 ， 现 在 被 广 
泛称 为 程序 设计 。 虽然 计 算 机 科学 的 组 成 部 分 并 不 只 有 计算 机 程序 设计 , 还 包括 许多 其 他 方面 ， 
但 是 通过 设计 可 执行 算法 (程序 ) 解决 问题 的 能 力 依然 是 所 有 计算 机 科学 家 的 一 项 基本 技能 。 

计算 机 硬件 只 能 执行 相对 简单 的 算法 步 又， 但 有 了 计算 机 程序 设计 语言 所 提供 的 抽象 ， 人 
类 就 能 针对 复杂 得 多 的 问题 ， 进 行 推理 并 制定 出 编码 解决 方案 。 下 面 这 几 个 关键 的 问题 为 我 们 
这 个 主题 的 讨论 提供 了 框架 。 

D 如 何 构建 程序 ? 

Q 程序 中 会 出 现 哪 些 类 型 的 错误 ? 

D 程序 中 的 错误 是 如 何 被 发 现 并 修复 的 ? 

Q 现代 程序 中 的 错误 对 程序 有 什么 影响 ? 

Q 如 何 对 程序 进行 文档 化 和 评估 ? 


0.4.6 ”因特网 


因特网 连接 了 全 世界 的 计算 机 和 电子 设置 ， 这 对 我 们 这 个 技术 社会 存储 、 检 索 和 共享 信息 
的 方式 产生 了 深远 的 影响 。 现 在 ， 商 业 、 新 闻 、 娱 乐 和 通信 都 越 来 越 依赖 这 个 由 较 小 的 计算 机 
网 络 组 成 的 互联 网 络 。 我 们 的 讨论 将 不 仅 限于 把 因特网 的 机 制 描述 为 人 工 制品 ， 还 会 涉及 人 类 
社会 业已 被 全 球 网 络 交 织 在 一 起 的 许多 方面 。 
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因特网 的 覆盖 对 我 们 的 隐私 和 个 人 信息 的 安全 也 有 着 深远 的 影响 。 网 络 空间 里 有 很 多 危险 ， 
所 以 在 我 们 这 个 互联 的 世界 里 ， 密 码 学 和 网 络 安全 正 变 得 越 来 越 重 要 。 


0.4.7 ”影响 


计算 机 科学 不 仅 对 我 们 使 用 的 通信 、 工 作 和 娱乐 的 技术 有 深远 的 影响 ， 对 我 们 的 社会 生活 
也 有 巨大 的 影响 。 计 算 机 科学 的 进步 正 淡化 着 许多 差别 ， 而 这 些 差别 正 是 我 们 过 去 作出 某 些 决 
策 的 基准 ; 计算 机 科学 的 进步 也 向 许多 长 久 以 来 的 社会 准则 提出 了 挑战 。 在 法 律 上 ， 因 此 产生 
了 某 些 疑问 一 一 知识 产权 的 度 以 及 伴随 这 个 所 有 权 的 权利 和 义务 。 在 伦理 上 ， 人 们 面临 着 许多 
挑战 传统 社会 行为 准则 的 抉择 。 对 于 政府 ， 又 产生 了 许多 争议 一 一 计算 机 技术 及 其 应 用 应 该 规 
范 到 什么 程度 ? 在 哲学 上 ， 人 们 开始 争论 智能 行为 的 存在 与 智能 本 身 的 存在 。 同 时 ， 整 个 社会 
也 在 讨论 : 新 的 计算 机 应 用 是 代表 新 的 自由 还 是 新 的 控制 。 

这 些 话题 对 于 那些 想 涉足 计算 或 者 计算 机 相关 领域 的 人 ， 还 是 很 重要 的 。 科 学 中 的 新 发 现 
有 时 会 使 许多 应 用 产生 和 争议， 这 使 人 们 对 相关 的 研究 人 员 产 生 极 大 不 满 。 进 一 步 而 言 ， 伦 理 上 
的 过 错 足以 挫 毁 本 可 以 很 成 功 的 事业 。 

计算 机 技术 的 发 展 给 人 们 提出 了 许多 难题 ， 而 具备 一 些 解决 此 类 问题 的 能 力 对 于 非 计算 机 
领域 的 人 也 十 分 重要 。 的 确 ， 计 算 机 技术 已 经 在 全 社会 迅速 普及 ， 几 乎 无 人 不 受 其 影响 。 

本 书 提供 了 一 些 技术 背景 , 有 助 于 人 们 以 一 种 理智 的 思维 来 处 理 计 算 机 科学 所 产生 的 问题 。 
然而 ， 计 算 机 科学 的 技术 知识 本 身 无 法 提供 全 部 问题 的 解决 办 法 。 因 此 ， 本 书 的 一 些 章节 致力 
于 介绍 计算 机 科学 的 社会 、 伦 理 和 法 律 上 的 问题 ， 包 括 安全 问题 、 软 件 所 有 权 和 义务 问题 、 数 
据 库 技术 的 社会 影响 以 及 人 工 智 能 发 展 的 后 果 。 

此 外 , 一 个 问题 通常 并 不 只 有 唯一 一 个 正确 的 答案 , 许多 有 效 的 解决 方案 都 是 在 两 个 对 立 的 (也 
许 都 是 有 理 的 ) 观点 之 间 进 行 折 中 的 。 寻 找 解决 方案 通常 需要 这 样 的 能 力 : 能 够 倾听 、 辨 别 其 他 各 
种 观点 、 开 展 理性 的 讨论 ， 并 在 获得 新 的 见解 时 改变 自己 的 观点 。 因 此 ， 本 书 每 章 最 后 都 有 一 系列 
“社会 问题 ” 研究 计算 机 科学 和 社会 的 关系 。 这 些 问题 不 是 需要 作答 的 ， 而 是 需要 思考 的 。 在 许多 
情况 下 ， 当 人 们 发 现 其 他 答案 时 ， 就 不 会 再 满意 于 那个 最 先 出 现 的 明显 答案 了 。 简 言 之 ， 给 出 这 些 
问题 的 目的 ， 并 不 是 让 大 家 找到 “正确 ”答案 ， 而 是 要 提高 大 家 的 意识 : 要 意识 到 一 个 问题 会 牵扯 
多 位 利益 相关 者 ， 一 个 问题 会 有 多 个 解决 方案 ， 那 些 解决 方案 都 同时 具有 长 短期 效应 。 

哲学 家 在 基础 理论 的 研究 中 提出 了 许多 伦理 学 方法 ， 从 而 产生 了 指导 决策 和 行为 的 原则 。 

性 格 伦理 (有 时 称 为 德行 伦理 ) 是 由 柏拉图 和 亚 里 士 多 德 提 出 的 ， 他 们 认为 “好 行为 ”不 
是 应 用 可 识别 规则 的 结果 ， 而 是 “良好 性 格 ” 的 自然 结果 。 而 其 他 伦理 基础 〈 如 结果 伦理 、 职 
责 伦理 以 及 合同 伦理 ) 认为 ， 一 个 人 在 解决 伦理 难题 时 ， 应 该 考虑 的 是 :“ 结 果 会 怎样 ? ”“ 我 
的 职责 是 什么 ? ”或 者 “我 有 什么 合同 ? ”而 性 格 伦理 考虑 的 是 :“ 我 想 成 为 什么 样 的 人 ? ” 因 
此 ， 好 行为 是 建立 在 好 性 格 基础 上 的 ， 而 这 通常 得 益 于 良好 的 教育 以 及 德行 习惯 。 

在 向 不 同 专业 领域 人 士 教授 伦理 知识 时 ， 一 般 以 性 格 伦理 为 基础 。 不 用 教授 专门 的 伦理 理 
论 ， 只 要 举 一 些 能 够 暴露 该 专业 领域 中 各 种 伦理 问题 的 案例 即 可 。 然 后 ， 通 过 讨论 这 些 案例 的 利 
次， 让 这 些 专业 人 士 对 职业 生活 中 潜在 的 危险 有 一 个 更 清醒 、 更 深入 和 更 敏感 的 认识 ， 并 将 这 
种 认识 融入 到 他 们 的 性 格 中 。 这 就 是 每 章 最 后 设计 社会 问题 的 精神 所 在 。 








a mere ee EE et 


社会 问题 


希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 。 回 答 出 这 
些 问 题 还 不 够 ,还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 
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第 0 章 绪 论 


如 果 没 有 计算 机 革命 ， 我 们 现在 的 社会 将 有 很 大 不 同 。 人 们 已 经 广泛 接受 这 种 观点 。 
与 没有 计算 机 革命 的 社会 相 比 ， 现 在 的 社会 是 更 好 了 ? 还 是 更 差 了 ? 如 果 你 在 社会 中 
的 地 位 不 同 ， 答 案 会 有 所 不 同 吗 ? 

想 参与 到 当今 的 技术 社会 中 ， 却 又 不 想 努 力 了 解 技术 的 基础 知识 ， 这 种 做 法 是 否 可 行 ? 
例如 ， 要 通过 表决 来 决定 如 何 支 持 和 使 用 某 种 技术 ， 那 么 表决 者 是 否 有 责任 了 解 那 种 
技术 ? 你 的 答案 是 否 与 具体 哪 种 技术 有 关 ? 例如 ， 考 虑 使 用 核 技术 时 和 考虑 使 用 计算 
机 技术 时 ， 回 答 是 否 一 样 ? 

传统 上 ， 人 们 使 用 现金 进行 交易 ， 因 而 处 理 账 务 时 不 需要 支付 服务 费用 。 然 而 ， 随 着 
我 们 经 济 生活 中 自动 化 程度 的 不 断 提 高 ， 金 融 机 构 正 在 对 这 些 自动 化 系统 的 使 用 推行 
服务 收费 .那么 “服务 收费 不 公正 地 限制 了 人 们 参与 经 济 活动 ”这 种 说 法 是 否 正确 呢 ? 
例如 ， 假 设 雇主 仅 用 支票 支付 雇员 的 工资 ， 并 且 所 有 金融 机 构 都 对 支票 兑现 和 存款 收取 
服务 费用 ， 那 么 雇员 是 否 因此 受到 了 不 公正 的 待遇 昵 ? 如 果 雇 主 坚 持 通过 直接 存款 的 方式 
支付 工资 ， 那 该 怎么 办 呢 ? 

在 交互 式 电视 节目 中 ， 某 一 个 公司 有 可 能 会 从 孩子 那里 获取 有 关 其 家 庭 的 信息 《也 许 
是 通过 交互 式 游戏 )， 那 应 该 控制 到 什么 程度 昵 ? 例 如 ， 是 否 可 以 允许 公司 通过 孩子 得 
知 其 父母 的 购物 习惯 ? 关于 孩子 自己 的 信息 呢 ? 

政府 对 计算 机 技术 及 其 应 用 的 法 规 管制 应 当 到 什么 程度 ? 例如 , 考虑 一 下 问题 3 和 问题 
4 中 提 到 的 问题 。 政 府 管制 的 依据 是 什么 ? 

对 于 技术 ， 尤 其 是 计算 机 技术 ， 我 们 所 作出 的 决策 会 对 我 们 的 后 代 产 生 多 大 的 影响 ? 
随 着 技术 的 进步 ， 我 们 的 教育 系统 不 断面 临 挑战 ， 要 重新 考虑 在 哪些 抽象 层次 上 安排 
哪些 主题 。 许 多 问题 是 类 似 的 ， 如 某 项 技能 是 否 必要 ， 是 否 允 许 学 生 依赖 某 种 抽象 工 
具 等 。 学 三 角 时 ， 不 再 教学 生 如 何 利用 函数 表 求 三 角 函 数 的 值 ， 而 是 允许 学 生 用 计算 
器 作为 抽象 工具 来 求 函数 值 。 有 些 人 认为 ， 长 除 也 应 该 让 位 于 抽象 。 还 有 哪些 主题 涉 
及 类 似 的 争论 ? 现代 的 文字 处 理 软件 是 否 会 使 人 们 不 需要 练习 书法 ? 视频 技术 的 使 用 
是 否 会 在 将 来 的 某 一 天 取代 阅读 ? 

公共 图 书馆 这 个 概念 ， 建 立 的 前 提 是 ， 民 主 国家 里 的 所 有 公民 都 有 权 获得 信息 。 越 来 
越 多 的 信息 通过 计算 机 技术 存储 和 传播 ， 是 否 每 一 位 公民 都 应 该 有 权利 访问 这 个 技术 
系统 呢 ? 答案 如 果 是 肯定 的 ， 那 么 公共 图 书馆 是 否 应 该 为 这 种 访问 提供 渠道 呢 ? 

在 一 个 依靠 抽象 工具 的 社会 里 ， 会 产生 什么 样 的 伦理 问题 呢 ? 是 否 存在 这 样 的 情况 ， 
当 我 们 使 用 某 个 产品 或 某 项 服务 时 ， 不 了 解 它 的 工作 原理 有 悖 伦理 吗 ? 那 不 知道 它 是 
如 何 生产 出 来 的 呢 ? 再 或 者 ， 不 了 解 其 使 用 的 副产品 呢 ? 


. 随 着 我 们 社会 的 逐步 自动 化 ， 政 府 监督 公民 的 活动 变 得 很 容易 。 这 是 好 还 是 坏 呢 ? 
. 乔治 。 奥 威 尔 〈 埃 里 克 。 布莱尔 ) 在 他 的 小 说 《1984》 中 想象 出 来 的 那些 技术 ， 其 中 


哪些 已 经 实现 ? 它们 的 使 用 方法 是 否 与 奥 威 尔 预想 的 一 样 ? 


. 如 果 你 有 一 台 时 间 机 器 ， 你 想 生活 在 哪 一 个 历史 阶段 ? 有 你 想 带 去 的 现代 技术 吗 ? 你 


所 选择 的 技术 可 以 脱离 其 他 技术 而 被 你 单独 带 走 吗 ? 一 项 技术 可 以 在 多 大 程度 上 独立 
于 其 他 技术 ? 抗议 全 球 变 暖 ， 却 又 接受 现代 医疗 ， 这 两 者 一 致 吗 ? 


. 假如 由 于 工作 关系 ， 你 必须 生活 在 另 一 种 文化 氛围 中 。 你 会 按照 自己 的 本 土 文化 习惯 


我 行 我 素 ， 还 是 会 选择 遵循 所 在 地 的 异域 生活 习俗 ? 对 这 个 问题 的 回答 ， 是 否 会 因 跟 
穿 衣 打扮 有 关 还 是 跟 人 权 有 关 而 不 同 呢 ? 如 果 你 是 在 本 国生 活 ， 但 需要 处 理 因 特 网 上 
各 种 外 来 文化 的 神 突 ， 那 你 会 坚持 什么 伦理 标准 ? 


. 在 商务 、 通 信 或 社交 互动 方面 ， 社 会 是 否 已 太 过 依赖 于 计算 机 应 用 ? 例如 ， 如 果 长 期 
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中 断 因 特 网 或 移动 电话 服务 ， 会 有 什么 后 果 ? 

15. 大 多 数 智 能 手机 都 能 够 利用 GPS 识别 手机 的 位 置 。 这 样 一 来 ， 相 关 的 应 用 程序 就 可 以 
基于 手机 的 当前 位 置 提 供与 该 位 置 相关 的 信息 《如 本 地 新 闻 、 本 地 和 天气， 或 者 附近 的 
商业 机 构 )。 然 而 ， 这 些 GPS 功 能 却 也 能 让 其 他 应 用 将 手机 的 位 置 广播 给 其 他 各 方 。 这 
样 好 吗 ? 手机 的 位 置 〈 继 而 手机 用 户 的 位 置 ) 信息 会 被 如 何 滥用 呢 ? 
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数据 存储 


本 章 中 ， 我 们 学 习 有 关 计算 机 中 数据 表示 和 数据 存储 的 内 容 。 我 们 要 研究 的 数据 类 
士 型 包括 文本 、 数 值 、 图 像 、 音 频 和 视频 。 除 了 传统 计算 外 ， 本 章 的 很 多 内 容 还 涉及 
数字 摄影 、 音 频 / 视 频 录制 和 复制 ， 以 及 远程 通信 等 领域 。 


本 章 内 容 

1.1 位 和 位 存储 *1.6 整数 的 存储 
1.2 主 存储 器 *1.7 小 数 的 存储 
13 海王 存 储 器 | 1 *].8 ”数据 与 程序 设计 
1.4 用 位 模式 表示 信息 ， *1.9 数据 压缩 

*1.5 二进制 系统 *1.10 通信 差错 





在 计算 机 科学 中 ， 我 们 首先 要 学 习 的 是 ， 信 息 是 如 何 编码 并 存储 在 计算 机 中 的 。 我 们 第 一 
步 要 讨论 的 是 计算 机 数据 存储 设备 的 基础 知识 ， 然 后 研究 如 何 对 信息 进行 编码 并 将 其 存储 到 这 
些 系统 内 。 最 后 我 们 将 探讨 现今 数据 存储 系统 的 各 个 分 支 ， 以 及 如 何 用 数据 压缩 和 错误 处 理 这 
样 的 技术 来 克服 它们 的 不 足 。 


在 现今 的 计算 机 中 ， 信 息 是 以 0 和 1 的 模式 编码 的 ， 这 些 数字 称 为 位 〈bit， 是 binary digit 的 
简写 , 意思 是 二 进 制 数 字 )。 尽 管 你 可 能 倾向 于 把 它们 与 数值 联系 在 一 起 , 但 它们 的 确 只 是 些 符 
号 ， 其 意义 取决 于 正在 处 理 的 应 用 : 它们 有 时 表示 数值 ， 有 时 表示 字母 表 里 的 字符 和 标点 符号 ， 
有 时 表示 图 像 ， 还 有 时 表示 声音 。 


1.1.1 布尔 运算 


为 了 理解 单个 的 位 在 计算 机 中 是 如 何 存储 和 操作 的 ， 这 里 我 们 假设 位 0 表示 假 〈false)， 位 1 
表示 真 《ture)。 为 了 纪念 数学 家 乔治 ， 布 尔 (George Boole，1815 一 1864)， 处 理 真 / 假 值 的 运算 
被 称 为 布尔 运算 (Boolean operation)。 乔 治 。 布 尔 是 逻辑 数学 领域 的 先驱 。3 个 基本 的 布尔 运算 
是 AND (与 )、OR (或 ) 和 XOR( 异 或 )， 图 1-1 概 述 了 这 三 种 运算 。( 我 们 之 所 以 用 大 写字 母 来 
表示 这 些 逻辑 运算 符 的 名 字 , 是 为 了 与 它们 对 应 的 英语 单词 区 分 开 来 。) 这 些 运 算 类 似 于 算术 运 
算 的 乘法 和 加 法 ， 因 为 它们 都 是 结合 一 对 值 (运算 输入 )， 得 出 第 三 个 值 (运算 输出 )。 不 过 ， 
与 算术 运算 不 同 的 是 ， 布 尔 运 算 结合 的 是 真 / 假 值 ， 而 不 是 数值 。 

布尔 运算 AND 可 用 于 计算 ， 连 接 词 AND 和 两 个 较 小 或 较 简单 的 语句 组 成 的 一 条 语句 的 真 / 
假 值 。 这 种 语句 的 一 般 形式 如 下 : 





1.1 位 和 位 存储 15 


PANDO 
其 中 ，P 代 表 一 个 语句 ，2 代 表 另 外 一 个 语句 。 例 如 ; 
克 米 特 是 一 只 青蛙 AND 佩 吉 小 姐 是 一 位 演员 
AND 运 算 的 输入 是 复合 语句 分 句 的 真 / 假 值 ， 输 出 则 是 复合 语句 本 身 的 真 / 假 值 。 因 为 P AND 0 


语句 的 值 只 有 在 其 两 个 分 句 都 是 真 时 才 为 真 ， 所 以 可 以 得 出 结论 : 1AND 1 的 输出 应 该 是 1， 而 
其 他 所 有 情况 的 输出 值 都 应 该 是 9， 如 图 1-1 所 示 。 














图 1-1 布尔 运算 AND、OR 和 XOR( 异 或 ) 的 输入 值 和 输出 值 

同 理 ，OR 运 算是 建立 在 如 下 形式 的 复合 语句 的 基础 之 上 的 : 

PORO 
其 中 ， 同 样 ，P 代 表 一 个 语句 ，2 代 表 另 外 一 个 语句 。 当 其 中 至 少 有 一 个 分 名 为 真 时 ， 语 名 才 为 
真 ， 如 图 1-1 所 示 。 

英语 中 没有 可 以 单独 表示 XOR 运 算 含义 的 连词 。 当 两 个 输入 一 个 为 1 ( 真 ), 男 一 个 为 0 ( 假 》 
时 ，XOR 运 算 的 输出 为 1 ( 真 )。 例 如 ，P XOR 0 语句 的 意思 是 “或 者 是 P， 或 者 是 0， 但 不 会 是 
两 个 共存 。”( 简 言 之 ， 当 两 个 输入 不 同时 ，XOR 运 算 的 输出 为 1。) 

NOT ( 非 ) 运算 是 另 一 个 布尔 运算 。 它 与 AND、OR 和 XOR 不 同 ， 因 为 它 只 有 一 个 输入 。 
它 的 输出 值 与 输入 值 是 相反 的 ;如 果 NOT 运 算 的 输入 值 为 真 ， 那 么 它 的 输出 值 就 为 假 ， 反 之 亦 
然 。 因 此 ， 如 果 NOT 运 算 的 输入 是 下 面 语句 的 真 / 假 值 : 

Fozzile 1s a bear. 
那么 ， 其 输出 就 是 下 面 语句 的 真 / 假 值 : 


Fozzie ls not a bear. 


1.1.2” 门 和 触发 器 


门 〈gate) 指 的 是 一 种 设备 ， 给 定 一 种 布尔 运算 的 输入 值 ， 门 可 以 得 出 该 布尔 运算 的 输出 
值 。 门 可 以 通过 很 多 种 技术 制造 出 来 ， 如 齿轮 、 继 电器 和 光学 设备 。 现 在 的 计算 机 中 ， 门 通常 
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是 由 小 型 电子 电路 实现 的 ， 其 中 数字 0 和 1 由 电压 电 平 表示 。 不 过 ， 我 们 不 需要 关注 这 些 细节 问 
题 。 对 于 我 们 来 说 ， 知 道 如 何 用 门 的 符号 形式 来 表示 门 就 足够 了 ， 如 图 1-2 所 示 。 注 意 ， 与 门 、 
或 门 、 异 或 门 和 非 门 ， 是 由 不 同形 状 的 符号 表示 的 ， 输 入 值 在 一 边 ， 输 出 值 在 男 一 边 。 

与 门 或 门 





图 1-2 与 门 、 或 门 、 异 或 门 和 非 门 的 图 形 表示 及 其 输入 输出 值 


门 为 构造 计算 机 提供 了 构件 。 计算机 构造 的 一 个 重要 步骤 如 图 1-3 的 电路 所 示 ， 这 个 电路 是 
触发 器 (flip-flop〉 电 路 的 一 个 特例 。 触 发 器 是 计算 机 存储 器 的 基本 部 件 ， 它 是 一 个 可 以 产生 0 
或 1 输出 值 的 电路 ， 它 的 值 会 一 直 保 持 不 变 ， 直 到 有 另 一 个 电路 过 来 的 临时 脉冲 (临时 变 成 1 之 
后 再 变 为 0) 使 其 变换 成 其 他 值 。 换 名 话说, 通过 设置 ,可 以 让 输出 在 外 界 刺激 的 控制 下 “ 记 住 ” 
0 或 者 1。 例 如 ， 在 图 1-3 中 ， 只 要 电路 的 两 个 输入 值 一 直 都 
是 0， 输 出 值 无 论 是 0 还 是 1) 就 不 会 变 。 不 过 ， 在 它 的 上 乱入 输出 
输入 端 临时 放置 一 个 1， 会 强制 其 输出 值 为 1; 反之 ， 在 它 的 
下 输入 端 临时 放置 一 个 1， 会 强制 其 输出 值 为 0。 

我 们 来 仔细 研究 一 下 这 个 问题 。 在 我 们 不 知道 图 1-3 中 
电路 的 当前 输出 值 的 情况 下 ， 假 设 上 面 的 输入 值 变 为 1， 而 
下 面 的 输入 值 仍 为 0 ( 见 图 1-4a)， 那 么 不 管 或 门 的 另外 一 个 
输入 值 是 什么 ， 它 的 输出 值 都 将 为 1。 接 着 ， 因 为 与 门 的 男 “ 箱 入 
外 一 个 输入 值 已 经 为 1 (触发 器 下 输入 端 为 0 时 非 门 的 输出 图 1-3 ”一 个 简单 的 触发 器 电路 
值 )， 所 以 它 的 两 个 输入 值 都 为 1。 于 是 ， 与 门 的 输出 值 变 成 
1， 这 意味 着 ,现在 或 门 的 第 二 次 输入 值 将 为 1 ( 见 图 1-4b)。 这 样 就 可 以 确保 即使 触发 器 上 面 的 
输入 值 变 回 0〈 见 图 1-4c)， 或 门 的 输出 值 也 会 保持 为 1。 总 之 ， 触 发 器 的 输出 值 已 经 为 1， 上 面 
的 输入 值 变 回 0 后 ， 其 输出 值 仍然 保持 不 变 。 
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0 





(a) 首先 ， 将 上 面 的 输入 置 1 (b) 这 使 或 门 的 输出 为 1， 接 着 使 与 门 的 输出 为 1 


0 
1 


0 
(c) 最 后 ， 将 上 面 的 输入 变 为 0 之 后 ， 由 于 与 门 的 输出 为 1， 所 以 或 门 的 输出 仍然 为 1 
图 1-4 将 一 个 触发 器 的 输出 值 设 置 为 ] 


同 理 ， 在 下 输入 端 上 临时 放置 数值 1， 会 强制 触发 器 的 输出 值 为 0， 而 且 输入 值 变 回 0 后 ， 输 
出 值 仍然 保持 不 变 。 

我 们 介绍 图 1-3 和 图 1-4 中 的 触发 器 电路 的 目的 有 3 个 。 第 一 ， 展 示 设 备 是 如 何 通过 门 制 造 出 
来 的 ， 这 是 一 个 数字 电路 的 设计 过 程 ， 是 计算 机 工程 领域 的 一 个 重要 课题 。 事 实 上 ， 在 计算 机 
工程 中 ， 触 发 器 只 是 诸多 基础 工具 电路 中 的 一 种 。 

第 二 ， 通 过 触发 器 的 概念 为 抽象 和 抽象 工具 的 使 用 提供 一 个 例子 。 事 实 上 ， 还 有 很 多 其 他 的 
构建 触发 器 的 方法 。 其 中 一 种 方法 如 图 1-5 所 示 。 ”输入 
如 果 你 用 这 个 电路 做 实验 就 会 发 现 , 尽管 它 有 着 不 
同 的 内 部 结构 ， 但 它 的 外 部 特性 与 图 1-3 中 的 是 一 
样 的 。 计 算 机 工程 师 不 必 知 晓 触 发 器 中 实际 使 用 的 
是 哪 种 电路 ， 只 需 理解 触发 器 的 外 部 特性 并 将 其 作 





为 一 个 抽象 工具 来 使 用 即 可 。 一 个 触发 器 和 其 他 定 入 > 给 
义 良好 的 电路 一 起 形成 了 一 个 构件 集合 ， 工 程 师 可 ; 
以 直接 利用 这 个 构件 集合 构造 更 复杂 的 电路 。 因此 ， ES 


计算 机 电路 的 设计 就 会 呈现 一 种 层次 结构 ， 其 中 每 一 层 都 将 较 低 层次 的 构件 作为 抽象 工具 使 用 。 

第 三 ， 触 发 器 是 现代 计算 机 中 存储 二 进 制 位 的 一 种 方法 。 更 确切 地 说 ， 可 以 将 触发 器 的 输 
出 值 设 置 为 0 或 1。 其 他 电路 可 以 通过 向 触发 器 的 输入 端 发 送 脉冲 来 调整 这 个 值 ， 还 有 一 些 电 路 
可 以 通过 将 这 个 触发 器 的 输出 用 作 它 们 的 输入 来 响应 存储 的 值 。 因 此 ， 许 多 触发 器 〈 被 构造 成 
非常 小 的 电子 电路 ) 可 以 用 作 计 算 机 内 部 记录 信息 的 一 种 方法 ， 将 信息 编码 成 0 和 1 的 模式 。 实 
际 上 ， 众 所 周知 的 超大 规模 集成 (very large-scale integration，VLSI) 技术 支持 将 数 百 万 个 电子 
元 件 构 造 在 一 个 称 为 芯片 (chip〉 的 唱片 上 ， 从 而 创建 出 包含 数 百 万 个 触发 器 及 其 控制 电路 的 
微型 设备 。 因 此 ， 这 些 芯 片 被 用 作 构 建 计 算 机 系统 的 抽象 工具 。 事 实 上 ， 在 某 些 情况 下 ， 还 可 
以 用 超大 规模 集成 技术 在 单 块 世 片 上 创建 整个 计算 机 系统 。 
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1.1.3 十 六 进 制 记 数 法 


当 我 们 考虑 计算 机 的 内 部 活动 时 ， 必 须 考虑 位 模式 〈 也 叫 位 串 ) 的 处 理 问题 ， 有 些 位 串 相 
= 长 位 串 常 被 称 为 流 (stream)。 不 幸 的 是 ， 人 脑 很 难 理 
解 流 。 即 便 只 是 抄录 位 模式 101101010011 也 会 令 人 厌烦 ， 而 全民 光 二 高三 删 村 系 
且 容 易 出 错 。 因此， 为 了 简化 这 种 位 模式 的 表示 方法 ， 我 们 dd 9» 


常 使 用 一 种 称 为 十 六 进 制 记 数 法 (hexadecimal notation) 的 简写 “ 人 Ln 
符号 ， 它 是 利用 机 器 位 模式 的 长 度 为 4 的 倍数 这 样 一 个 事实 制定 | oo 
的 。 具 体 来 说 就 是 ， 十 六 进 制 记 数 法 用 - 个 符号 表示 位 模式 的 4 i020 
位 。 例 如 ， 一 个 12 位 的 串 只 需要 3 个 十 六 进 制 符号 就 可 以 表示 。 0110 6 
图 1-6 展 示 了 十 六 进 制 编码 系统 。 左 边 一 列 是 所 有 长 度 为 4 人 
的 位 模式 ， 右 边 一 列 是 十 六 进 制 记 数 法 使 用 的 符号 ， 表 示 左 边 1001 9 
那 列 位 模式 。 使 用 这 个 系统 ， 位 模式 10110101 可 以 表示 为 B5。 Oo i 
具体 方法 是 ， 把 位 模式 拆 分 为 长 度 为 4 的 子 串 ， 然 后 用 十 六 进 | a : ol 下 
制 的 符号 代替 每 一 个 子 串 ， 即 用 B 来 表示 1011， 用 5 来 表示 0101。 ”1107 Dy 
同 理 ，16 位 模式 1010010011001000 可 以 简化 成 更 易 为 人 接受 的 1110 E 
形式 A4C8。 计生 二 训 到 
第 2 章 将 广泛 使 用 十 六 进 制 记 数 法 ， 由 此 你 就 能 体会 到 它 图 1.6 十 六 进 制 编码 系统 
的 效率 。 
问题 与 练习 


1. 什么 样 的 位 模式 输入 可 以 使 得 下 面 的 电路 输出 值 为 1? 


2. 对 于 图 1-3 中 的 触发 器 ， 我 们 在 文中 强调 ， 下 输入 端 放置 1 (同时 保持 上 输入 端 为 0), 会 迫使 触发 器 的 
输出 为 0。 描 述 一 下 这 种 情况 触发 器 内 部 的 活动 序列 。 
3. 假定 图 1-5 中 的 触发 器 的 输入 都 以 0 开始 ， 描 述 一 下 当 上 输入 端 被 临时 设 为 1 时 所 发 生 的 活动 序列 。 
4. a. 如 果 一 个 与 门 的 输出 值 传递 给 了 一 个 非 门 , 那么 这 个 组 合 电 路 计算 的 布尔 运算 称 为 与 非 (NAND )， 
当 且 仅 当 两 个 输入 值 都 为 1 时 ,输出 值 为 0。 与 非 门 的 符号 和 与 门 的 符号 类 似 , 只 是 输出 有 一 个 圆圈 。 
下 面 的 电路 包含 一 个 与 非 门 。 这 个 电路 完成 的 是 什么 布尔 运算 ? 


输入 
输出 
输入 
b. 如 果 一 个 或 门 的 输出 值 传递 给 了 一 个 非 门 ， 那 么 这 个 组 合 电路 计算 的 布尔 运算 称 为 或 非 (NOR )， 
当 且 仅 当 两 个 输入 值 都 为 0 时 ， 输 出 值 为 1。 或 非 门 的 符号 和 或 门 的 符号 类 似 ， 只 是 输出 有 一 个 圆圈。 
下 面 的 电路 包含 一 个 与 门 和 两 个 或 非 门 。 这 个 电路 完成 的 是 什么 布尔 运算 ? 
输入 


输入 


1.2 主 存储 器 


5. 用 十 六 进 制 记 数 法 来 表示 下 面 的 位 模式 。 : 
a. 0110101011110010  b.111010000101010100010111 ec.01001000 


6. 下 面 的 十 六 进 制 模式 表示 的 是 什么 位 模式 ? | 
a. SFD97 b. 610A cABCD d. 0100 


1.2 主 存储 器 


为 了 存储 数据 ， 计 算 机 包含 大 量 的 电路 (如 触发 器 )， 每 一 个 电路 能 够 存储 一 个 位 。 这 种 位 
存储 器 被 称 为 计算 机 的 主 存储 器 (main memory )。 


1.2.1 存储 器 结构 


计算 机 的 主 存储 器 是 由 称 为 存储 单元 (cell) 的 可 管理 单位 组 成 的 ， 一 个 典型 存储 单元 的 容 
量 是 8 位 。 因 为 一 个 8 位 的 串 称 为 一 个 字 节 〈byte)， 所 以 一 个 典型 存储 单元 的 容量 是 一 个 字 节 。 
像 微 波 炉 这 样 的 家 用 电器 中 嵌入 的 小 型 计算 机 的 主 存 储 器 ， 可 能 仅仅 包含 几 百 个 存储 单元 ,但 
是 大 型 计算 机 的 主 存储 器 可 能 有 几 十 亿 个 存储 单元 。 

虽然 计算 机 中 没有 左 或 右 的 概念 ， 但 是 我 们 通常 假设 存储 单元 的 位 是 排 成 一 行 的 。 该 行 的 
左 端 称 为 高 位 端 (high-order end)， 右 端 称 为 低位 端 (low-order end)。 高 位 端的 最 左 一 位 称 作 高 
位 或 最 高 有 效 位 (most significant bit)。 取 这 个 名 称 是 因为 ， 如 果 把 存储 单元 里 的 内 容 解 释 为 数 
值 ， 那 么 这 一 位 就 是 该 数 的 最 高 有 效 数 字 。 类 似 地 ， 低 位 端的 最 右 一 位 称 为 低位 或 最 低 有 效 位 
(least significant bit)。 于 是 ， 我 们 可 以 如 图 1-7 所 示 
的 那样 描述 字 节 型 存储 单元 的 内 容 。 

为 了 区 分 计算 机 主 存储 器 中 的 各 存储 单元 ， 每 
一 个 存储 单元 都 被 赋予 了 一 个 唯一 的 “名 字 ”， 称 为 
地 址 (address)。 这 类 似 于 通过 地 址 找到 城市 里 的 一 图 1-7 字 节 型 存储 单元 的 结构 
座 座 房屋 。 不 过 ， 存 储 单元 中 的 地 址 都 是 用 数字 表 
示 的 。 更 精确 地 说 , 我 们 把 所 有 的 存储 单元 都 看 作 是 排 成 一 行 的 , 并 按照 这 个 顺序 从 0 开始 编号 。 
这 样 的 编 址 系统 不 仅 为 我 们 提供 了 唯一 标识 每 个 存储 单元 的 方法 ， 而 且 也 给 存储 单元 赋予 了 顺 
序 的 概念 〈 见 图 1-8)， 这 样 就 有 了 诸如 “下 一 个 单元 ”“ 前 一 个 单元 ”的 说 法 。 











图 1-8 ” 按 地 址 排列 的 存储 单元 
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将 主 存储 器 中 的 存储 单元 和 每 个 存储 单元 中 的 位 都 进行 排序 ， 会 产生 一 个 重要 的 结果 : 计 
算 机 主 存储 器 的 所 有 二 进 制 位 会 实际 排 成 一 长 行 。 这 个 长 行 上 的 片段 可 以 存储 的 位 模式 因此 比 
单个 存储 单元 要 长 。 特 别 是 ， 我 们 只 需要 两 个 连续 的 存储 单元 就 可 以 存储 16 位 的 串 。 

为 了 做 成 一 台 计 算 机 的 主 存储 器 ， 实 际 存放 二 进 制 位 的 电路 还 组 合 了 其 他 的 电路 ， 这 个 电 
路 使 得 其 他 电路 可 以 在 存储 单元 中 存 入 和 取出 数据 。 以 这 种 方式 ， 其 他 电路 可 以 通过 电信 和 号 请 
求 从 存储 器 中 得 到 指定 地 址 的 内 容 ( 称 为 读 操作 ), 或 者 通过 请 求 把 某 个 位 模式 存放 到 指定 地 址 
的 存储 单元 里 〈 称 为 写 操作 )。 

因为 计算 机 的 主 存储 器 是 由 独立 的 、 可 编 址 的 存储 单元 组 成 的 ， 所 以 可 以 根据 需要 独立 访 
问 这 些 存 储 单元 。 为 了 反映 用 任何 顺序 访问 存储 单元 的 能 力 ， 计 算 机 的 主 存储 器 常 被 称 为 随机 
存 取 存储 器 (random access memory，RAM)。 主 存储 器 的 这 种 随机 存 取 特性 ， 与 1.3 节 中 将 要 讨 
论 的 海量 存储 系统 ， 形 成 了 鲜明 的 对 比 ， 在 海量 存储 系统 中 ， 长 位 串 被 当 作 合并 块 来 操控 。 

尽管 我 们 介绍 说 ， 触 发 器 是 存储 二 进 制 位 的 一 种 方法 ， 但 是 在 现代 的 大 多 数 计算 机 中 ，RAM 


中 许多 技术 将 位 存储 为 可 快速 消散 的 电荷 。 因 此 ， 这 些 设备 需要 附加 电路 ( 称 为 刷新 电路 )， 在 
1 秒 内 反复 补充 电荷 很 多 次 。 因 为 它 的 这 种 不 稳定 性 ， 通 过 这 种 技术 构造 的 计算 机 存储 器 常 被 
称 为 动态 存储 器 (dynamic memory)， 于 是 就 产生 了 术语 DRAM ( 读 作 “DEE-ram”)， 用 来 表示 
动态 RAM (dynamic RAM)。 有 时 动态 存储 器 会 用 术语 SDRAM ( 读 作 “ES-DEE-ram”) 来 表示 
同步 DRAM (synchronous DRAM)， 采 用 这 种 附加 技术 可 以 缩短 从 存储 单元 取出 信息 所 需要 的 
时 间 。 


1.2.2 存储 器 容量 的 度量 


在 第 2 章 我 们 会 学 到 ， 如 果 主 存储 器 中 存储 单元 的 总 数 是 2 的 震 ， 那 么 主 存储 器 设计 起 来 会 
很 方便 。 因 此 ， 早 期 计算 机 存储 器 的 大 小 通常 以 1024( 即 2”) 个 存储 单元 为 单位 来 度量 。 因 为 
1024 接 近 于 数值 1000, 所 以 计算 机 行业 的 许多 人 采用 前 级 千 (kilo) 来 表示 这 个 单位 。 也 就 是 说 ， 
术语 千 字 节 (kilobyte， 符 号 表示 为 KB) 被 用 于 表示 1024 字 节 。 因 此 ， 带 有 4096 个 存储 单元 
的 机 器 会 被 说 成 是 有 一 个 4KB 的 存储 器 (4096=4x1024)。 随 着 存储 器 容量 的 增 大 ， 这 个 术语 
逐渐 扩大 到 了 兆 字 节 (megabyte， 符 号 表示 为 MB )、 吉 字 节 (gigabyte， 符 号 表示 为 GB) 和 
太 字 节 (terabyte， 符 号 表示 为 TB)。 遗憾 的 是 ， 这 种 前 级 千 〈kilo-)、 光 (mega-) 等 的 用 法 属 
于 术语 的 误 用 ， 因 为 这 些 前 级 已 经 是 其 他 领域 用 于 指称 1000 的 容 。 例 如 ， 在 度量 距离 时 ， 千 米 
(kilometer) 指 的 是 1000 米 ， 在 度量 无 线 电 频 率 时 ， 兆 赫 〈megahertz ) 指 的 是 1 000 000 赫 效 。 在 
20 世 纪 90 年 代 后 期 ， 国 际 标准 组 织 为 2 的 索 制 定 了 专门 的 术语 : 千 位 字 节 (kibi-byte)、 兆 位 字 节 
(mebi-byte)、 吉 位 字 节 (gibi-byte》 和 太 位 字 节 〈ilepibyte)， 用 来 表示 1024 的 宗 ， 而 不 是 1000 
的 暴 。 然 而 ， 尽 管 这 种 区 别 在 世界 上 许多 地 方 的 当地 法 律 里 都 有 规定 ， 但 一 直 以 来 ， 普 通 大 众 
和 许多 计算 机 科学 家 都 不 愿意 放弃 这 个 已 经 比较 熟悉 但 会 引起 歧义 的 “ 兆 字 节 ”(megabyte)。 
因此 ， 提 醒 大 家 : 一 般 说 来 ， 千 、 光 等 术语 在 涉及 计算 机 度量 时 表示 2 的 暴 , 但 在 其 他 环境 中 表 
示 1000 的 宕 。 


问题 与 练习 


1. 如 果 地 址 为 5 的 存储 单元 存 有 值 8， 那 么 “将 值 S 写 入 6 号 存储 单元 ”和 “将 5 号 存储 单元 的 内 容 移 到 6 
号 存储 单元 ”之 间 有 什么 差别 ? 

2. 假定 你 想 交 换 存储 在 2 号 和 3 号 存储 单元 中 的 值 。 那 么 下 面 的 步骤 错 在 哪里 ? 
步骤 1: 把 2 号 存储 单元 中 的 内 容 移 到 3 号 存储 单元 。 
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步骤 2: 把 3 号 存储 单元 中 的 内 容 移 到 2 号 存储 单元 。 
请 设计 能 够 正确 交换 这 两 个 存储 单元 内 容 的 步骤 。 如 有 必要 ， 可 以 使 用 额外 的 存储 单 元 。 
3. 一 台 带 有 4KB 存 储 器 的 计算 机 ， 其 存储 器 里 有 多 少 个 二 进 制 位 ? 
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1.3 海量 存储 器 


由 于 计算 机 主 存储 器 的 不 稳定 性 和 容量 的 限制 ， 大 多 数 计算 机 都 有 称 为 海量 存储 (mass 
storage， 或 者 二 级 存储 ) 系统 的 附加 存储 设备 ， 包 括 人 磁盘 、CD 盘 、DVD 般 、 人 磁带 、 yi 
和 固态 硬盘 (所 有 这 些 我 们 稍 后 会 讨论 )。 相 对 于 主 存储 器 ,海量 存储 系统 的 优点 是 更 稳定 、 
量 大 、 价 格 低 ， 并 且 在 许多 情况 下 ， 能 从 机 器 上 取 下 存储 媒介 进行 存档 。 

磁性 和 光学 海量 磁 存 储 系统 和 海量 光 存 储 系统 的 主要 不 足 是 ， 它 们 一 般 都 需要 机 械 运 动 。 
因为 主 存储 器 的 所 有 工作 都 是 由 电子 器 件 实现 的 , 所 以 比 起 计算 机 主 存储 器 来 ,海量 存储 系统 
的 数据 存 取 需 要 花费 更 长 的 时 间 。 此 外 ， 与 固态 系统 相 比 ， 带 有 移动 部 件 的 存储 系统 更 容易 出 
现 机 械 故 障 。 


1.3.1 磁 系统 


很 多 年 以 来 ， 磁 技术 已 经 占据 了 海量 存储 领域 。 最 常见 的 例子 便 是 我 们 现在 使 用 的 磁盘 
(magnetic disk) 或 者 硬盘 驱动 器 (hard disk drive，HDD)， 它 里 面 是 可 以 旋转 的 薄 盘 片 ， 表 面 有 
用 以 存储 数据 的 磁 介 质 涂 层 (图 1-9)。 读 / 写 磁 头 安装 在 盘 片 的 上 面 和 /或 下 面 ， 当 盘 片 旋转 时 ， 每 
个 磁头 在 盘 片 上 面 或 下 面相 对 于 称 为 磁道 (track) 的 圆圈 转动 。 通 过 重 定位 读 / 写 磁头 ， 可 以 对 各 
个 同心 的 磁道 进行 存 取 。 在 很 多 情况 下 ， 一 个 磁盘 存储 系统 包含 若干 个 盘 片 ， 这 些 盘 片 安装 在 同 
一 根 轴 上 ， 层 县 在 一 起 ， 盘 片 之 间 有 足够 读 / 写 磁 头 滑 动 的 空间 。 在 这 种 情况 下 ， 所 有 读 / 写 磁 头 
是 一 起 移动 的 。 每 当 读 / 写 磁头 重 定位 时 ， 都 可 以 访问 一 组 新 磁道 ， 这 组 磁道 称 为 柱 面 (cylinder)。 


划分 为 扇 区 的 磁道 





读 / 写 磁头 





辟 运 动 方 向 
磁盘 旋转 方向 
图 1-9 ”磁盘 存储 系统 


因为 一 个 磁道 可 以 包含 的 信息 通常 比 我 们 每 一 次 想 要 处 理 的 多 ， 所 以 每 个 磁道 又 被 划分 成 
若干 个 称 为 扇 区 〈sector) 的 小 弧 区 ， 这 些 扇 区 上 记录 的 信息 是 连续 的 二 进 制 位 串 。 磁 盘 上 所 有 
的 扇 区 都 包含 相同 数目 的 二 进 制 位 〈 典 型 的 容量 是 512 个 字 节 到 若干 KB)， 而 且 在 最 简单 的 磁盘 
存储 系统 里 ， 每 一 个 磁道 包含 的 扇 区 数 都 相同 。 因 此 ， 靠 近 盘 片 外 边缘 的 磁道 扇 区 上 的 位 的 存 
储 密度 ， 要 比 靠近 盘 片 中 心 的 磁道 上 的 小 ， 因 为 外 磁道 比 内 磁道 长 。 相 反 ， 在 大 容量 磁盘 存储 
系统 里 ， 靠 近 外 边缘 的 磁道 包含 的 扇 区 要 远 多 于 靠近 中 心 的 磁道 ， 这 种 存储 能 力 常 通过 一 种 称 
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作 区 位 记录 〈zoned-bit recording，ZBR) 的 技术 得 以 应 用 。 在 使 用 区 位 记录 技术 时 ， 一 些 相 邻 
的 磁道 会 被 统称 为 区 ， 一 个 典型 的 盘 片 大 约 包含 10 个 区 。 一 个 区 的 所 有 磁道 有 相同 数目 的 扇 区 ， 
但 是 靠 外 的 区 中 每 一 个 磁道 包含 的 扇 区 数 ， 比 靠 内 的 区 中 每 一 个 磁道 包含 的 扇 区 数 多 。 采 用 这 
种 方式 ， 能 够 有 效 利用 整个 磁盘 的 表面 。 不 管 细节 如 何 ， 一 个 磁盘 存储 系统 都 包含 许多 独立 的 
扇 区 ， 每 一 个 扇 区 都 可 以 作为 独立 的 位 串 进行 存 取 。 

一 个 磁盘 存储 系统 的 容量 取决 于 使 用 的 盘 片 数目 以 及 磁道 与 局 区 的 划分 密度 。 容 量 较 小 的 
系统 可 能 只 有 一 个 盘 片 。 大 容量 磁盘 系统 的 容量 可 达 数 GB， 甚 至 TB， 同 一 根 轴 上 可 能 装 有 3 到 
6 个 盘 片 。 此 外 ， 数 据 有 可 能 存储 在 每 个 盘 片 的 上 下 两 面 。 

有 4 个 标准 可 以 用 来 评估 一 个 磁盘 系统 的 性 能 : (1) 寻 道 时 间 (seek time)， 读 / 写 磁 头 从 一 
个 磁道 移 到 另 一 个 磁道 所 需要 的 时 间 ; (2) 旋转 延迟 (rotation delay ) 或 等 待 时 间 (latency time )， 
盘 片 旋转 一 周 所 需 时 间 的 一 半 , 也 就 是 读 / 写 磁头 到 达 所 要 求 磁 道 后 , 等 待 盘 片 旋转 使 读 / 写 磁头 
位 于 所 要 存 取 的 数据 《〈 扇 区 ) 上 所 需要 的 平均 时 间 ; (3) 存 取 时 间 (access time)， 即 寻 道 时 间 
和 旋转 延迟 之 和 ; (4) 传输 速率 (transfer rate)， 在 磁盘 上 读 出 或 写 入 数据 的 速率 。 需 要 注意 的 
是 ， 在 区 位 记录 存储 情况 下 ， 盘 片 旋 转 一 次 ， 外 区 磁道 通过 读 / 写 磁头 传递 的 数据 量 ， 要 多 于 内 
区 磁道 ， 因 此 ， 数 据 传输 速率 会 随 所 使 用 的 盘 片 部 位 的 不 同 而 有 所 变化 。 

限制 磁盘 存 取 时 间 和 传输 速率 的 一 个 因素 是 磁盘 系统 旋转 的 速度 。 为 了 支持 高 速 旋转 ， 这 
些 系统 里 的 读 / 写 磁头 并 不 接触 盘 片 ， 而 只 是 “悬浮 ”在 盘 片 表面 。 磁 头 与 盘 片 之 间 的 空间 很 小 ， 
以 至 于 一 粒 小 小 的 灰尘 都 可 能 卡 在 其 中 ， 导 致 磁盘 和 磁头 损坏 ， 这 一 现象 便 是 磁头 划 伤 (head 
crash)。 因 此 ， 磁 盘 系 统 出 厂 时 都 密封 在 箱子 里 。 凭 借 这 样 的 构造 ， 磁 盘 系 统 能 够 以 每 秒 几 百 次 
的 速度 旋转 ， 达 到 每 秒 数 以 MB 的 传输 速率 。 

因为 磁盘 系统 的 操作 需要 物理 运动 ， 所 以 难以 与 电子 电路 的 速度 相 比 。 电 子 电路 的 延迟 时 
间 是 以 纳 秒 《〈 十 亿 分 之 一 秒 ) 甚至 更 小 的 时 间 单 位 计算 的 ， 而 磁盘 系统 的 寻 道 时 间 、 等 待 时 间 
和 存 取 时 间 是 以 毫秒 〈 千 分 之 一 秒 ) 度量 的 。 因 此 ， 与 电子 电路 等 待 结果 的 时 间 相 比 ， 从 磁盘 
系统 检索 信息 所 需要 的 时 间 非 常 长 。 

磁 存 储 技术 现在 很 少 使 用 了 , 包括 磁带 (magnetic tape) 和 软盘 驱动 器 (floppy disk drive ) 。 
人 磁带 是 将 信息 记录 在 一 条 绕 在 卷轴 上 的 薄 塑 料 带 的 磁 涂 层 上 ， 软 盘 驱 动 器 则 是 将 带 有 磁 涂 层 
的 单个 盘 片 封 在 一 个 为 了 便于 从 驱动 器 中 取出 而 设计 的 便携 式 的 盒子 里 。 磁 带 驱动 器 的 寻 道 
时 间 极 长 ， 它 和 它 的 兄弟 一 一 录音 带 一 一 一 样 ， 都 要 花费 很 长 的 倒 带 时 间 和 快 进 时 间 。 不 过 ， 
低 成 本 和 大 数据 容量 ， 使 磁带 非常 适用 于 那些 数据 主要 被 线性 读 或 写 的 应 用 ， 如 存档 数据 备 
份 。 虽 然 软盘 盘 片 的 可 移动 特性 是 以 比 硬 盘 盘 片 低 得 多 的 数据 密度 和 存 取 速 度 为 代价 的 ， 但 
是 ， 在 更 大 容量 、 更 耐用 的 闪存 驱动 器 诞生 之 前 的 几 十 年 里 ， 软 盘 盘 片 的 便携 性 还 是 极其 有 
价值 的 。 

1.3.2 ” 光 系 统 

另 一 类 海量 存储 器 应 用 的 是 光 技 术 。 光 盘 (compact disk，CD) 就 是 其 中 的 一 种 。 光 盘 的 
直径 为 12 厘 米 〈 大 约 5 英 寸 )， 由 涂 着 光洁 保护 层 的 反射 材料 制 成 。 光 盘 上 的 信息 是 通过 在 反 
射 层 上 创建 偏差 的 方法 记录 的 ， 可 以 通过 激光 检测 CD 快速 旋转 时 反射 层 的 不 规则 反射 偏差 来 
读 取 。 

CD 技术 最 初 是 用 于 音频 记录 的 ， 采 用 的 记录 格式 叫 作 数字 音频 光盘 (compact disk-digital 
audio，CD-DA)， 而 现在 的 CD， 作 为 计算 机 的 数据 存储 设备 ， 实 质 上 使 用 的 仍 是 同样 的 格式 。 
特别 值得 一 提 的 是 ，CD 上 的 信息 存储 在 一 条 磁道 上 ， 它 呈 螺 旋 形 缠绕 在 CD 上 ， 很 像 老式 留 声 
机 唱片 里 的 止 槽 ， 不 过 与 老式 留声机 唱片 不 同 的 是 ，CD 上 的 磁道 是 由 内 至 外 的 〈 见 图 1-10)。 
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这 条 磁道 被 划分 为 称 为 鹿 区 的 单元 ， 每 个 扇 区 都 有 数据 记录 在 分 为 若干 扇 区 的 磁 


自己 的 标识 ,数据 存储 容量 为 2 KB， 这 个 容量 在 录 el 
制 音频 时 ， 大 约 能 录制 -< 秒 的 音乐。 


需要 注意 的 是 ， 盘 片 外 边缘 螺旋 形 磁 道 的 距 
离 比 内 部 螺旋 形 磁道 的 要 长 。 为 了 使 CD 的 存储 能 
力 达 到 最 大 ， 信 息 是 按照 统一 的 线性 密度 存储 在 
整个 螺旋 形 磁 道上 的 ， 这 就 意味 着 ， 在 螺旋 形 磁 
道上 ， 外 部 边缘 环 道 存 放 的 信息 比 内 部 环 道 的 多 。 
所 以 ， 如 果盘 片 旋转 一 整 园 ， 激 光 在 扫描 外 部 曙 I 
旋 形 磁道 时 ， 读 到 的 扇 区 个 数 要 比 扫描 内 部 时 读 到 的 多 。 因 此 ， 为 了 获得 统一 的 数据 传输 速 
率 ，CD-DA 播 放 器 要 能 够 根据 激光 在 盘 片 上 的 位 置 来 调整 盘 片 的 旋转 速度 。 不 过 ， 由 于 用 于 
计算 机 数据 存储 的 大 多 数 CD 系统 , 其 盘 片 都 是 以 比较 快 的 恒定 速度 旋转 的 , 所 以 其 CD 驱动 器 
必须 适应 数据 传输 速率 的 变化 。 

由 于 采用 这 种 设计 思想 ，CD 存 储 系 统 在 处 理 长 且 连 续 的 数据 串 〈 如 音乐 复制 ) 时 ， 表 现 最 
好 。 但 是 ， 当 一 个 应 用 需要 随机 存 取 数 据 项 时 ， 磁 盘存 储 器 所 用 的 方法 (单个 的 同心 磁道 被 划 
分 成 独立 存 取 的 扇 区 ) 就 优 于 CD 所 用 的 螺旋 形 方法 。 

传统 CD 的 存储 容量 是 600 一 700 MB。 但 是 ， 数 字 多 功能 光碟 (digital versatile disk，DVD ) 
可 具有 多 达 几 个 GB 的 存储 容量 ， 它 由 多 个 半 透 明 的 层面 构成 ， 精 确 聚 焦 的 激光 可 以 识别 其 不 同 
的 层面 。 这 种 盘 片 能 够 存储 了 元 长 的 多 媒体 信息 ， 包 括 完 整 的 电影 。 最 后 ， 蓝 光 技 术 (blu-ray 
technology ) 使 用 蓝 色 (而 非 红 色 ) 激 光 , 能 够 极为 精确 地 聚焦 激光 束 。 因 此 , 蓝光 光碟 (blu-ray 
disk，BD) 的 容量 是 DVD 的 5 倍 多 ， 其 巨大 的 存储 器 容量 能 满足 高 清 视频 的 需要 。 


1.3.3 ”闪存 驱动 器 


基于 磁 技 术 或 光 技术 的 海量 存储 系统 的 一 个 普遍 特征 是 , 通过 物理 运动 来 存储 和 读 取信 息 ， 
例如 ， 旋 转 磁 盘 、 移 动 读 / 写 磁 头 和 扫描 激光 束 。 这 就 意味 着 ， 其 数据 的 存储 和 读 取 速 度 比 电 子 
电路 的 要 慢 。 闪 存 (flash memory ) 技术 有 克服 这 个 缺点 的 潜力 。 在 闪存 系统 里 ， 二 进 制 位 是 由 
电子 信号 直接 发 送 到 存储 介质 中 的 ， 电 子 信号 使 得 该 介质 中 二 氧化 硅 的 微小 品格 截获 电子 ， 从 
而 转换 微 电 子 电 路 的 性 质 。 因 为 这 些微 小 唱 格 能 够 在 没有 外 力 的 情况 下 保持 截获 的 电子 很 多 年 ， 
所 以 闪存 技术 非常 适合 存储 可 移植 的 、 非 易 失 性 数据 。 

尽管 存储 在 闪存 系统 里 的 数据 能 够 像 在 RAM 应 用 中 一 样 ， 以 小 字 节 单元 存 取 ， 但 是 现代 技 
术 规 定 存储 的 数据 应 批量 擦 除 。 不 过 ， 反 复 的 擦 除 会 逐渐 损坏 二 氧化 硅 的 晶 格 ， 这 就 意味 着 ， 
现今 的 闪存 技术 不 适合 一 般 的 主 存储 器 应 用 ,因为 主 存储 器 的 内 容 一 秒 可 能 要 改 很 多 次 。 然 而 ， 
在 那些 改变 可 以 被 控制 在 一 个 合理 的 水 平 的 应 用 里 (如 数码 相机 和 智能 手机 )， 闪存 已 经 成 为 海 
量 存储 技术 的 一 个 选择 。 的 确 ， 因 为 内 存 对 物理 震动 不 敏感 (与 磁 系 统 和 光 系 统 不 同 )， 所 以 它 
现在 正 代 替 便 携 式 应 用 《〈 如 笔记 本 电脑 ) 中 的 其 他 海量 存储 技术 。 

闪存 设备 称 为 闪存 驱动 器 (flash drive)， 容 量 可 达 几 百 GB， 可 用 于 一 般 的 海量 存储 应 用 。 
闪存 设备 被 封装 在 极 小 的 塑料 格子 里 ， 其 一 端 有 一 个 可 以 取 下 的 帽 ， 当 驱动 器 处 于 脱 机 状态 时 ， 
可 以 保护 这 个 设备 的 电子 连接 器 。 因 为 这 些 便携 设备 容量 大 , 很 容易 与 计算 机 进行 连接 或 断 开 ， 
所 以 是 理想 的 便携 数据 存储 器 。 不 过 ， 由 于 它们 的 微小 存储 唱 格 的 缺点 ， 当 涉及 真正 长 期 应 用 
时 ， 它 们 不 如 光学 盘 片 可 靠 。 

较 大 的 办 存 驱 动 器 称 为 固态 硬盘 (solid-state disk，SSD)， 是 专 为 替代 磁 硬 盘 设 计 的 。 与 
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硬盘 相 比 ， 固 态 硬盘 防震 抗 摔 性 能 更 好 ， 能 更 安静 地 运行 〈 因 为 没有 移动 部 件 )， 存 取 时 间 更 
短 。 不 过 ， 固 态 硬 盘 要 比 同等 大 小 的 硬盘 贵 ， 所 以 在 购买 计算 机 时 ， 它 仍然 被 看 作 是 高 端 选 
择 。 虽 然 固 态 硬 盘 扇 区 也 受 所 有 闪存 技术 所 共有 的 寿命 比较 有 限 的 影响 ， 但 通过 耗损 均衡 
(Cwear-leveling) 技术 频繁 地 将 改变 的 数据 块 重 定位 到 驱动 器 中 使 用 次 数 最 少 的 位 置 上 ， 可 以 减 
小 这 个 影响 。 

闪存 技术 的 另 一 应 用 是 安全 数字 〈secure digital，SD ) 存储 卡 ‘memory card)， 简 称 SD 卡 。 
SD 卡 的 容量 高 达 2 GB， 它 们 被 制 成 塑料 封装 的 唱 圆 ， 有 邮票 大 小 (还 有 更 小 的 小 型 和 微型 SD 
卡 )， 其 中 ， 安 全 数字 高 容量 (secure digital high capacity，SDHC) 存储 卡 (简称 SDHC 卡 ) 的 
存储 容量 可 以 高 达 32 GB， 新 一 代 的 安全 数字 扩展 容量 (secure digital extended capacity, SDXC) 
存储 卡 〈 人 简称 SDXC 卡 ) 的 容量 可 超过 1 TB。 由 于 这 些 卡 物理 结构 紧凑 ， 可 以 方便 地 插入 小 型 
电子 设备 的 插 槽 ， 因 此 它们 是 数码 相机 、 智 能 手机 、 音 乐 播放 器 、 汽 车 导航 系统 ， 以 及 其 他 许 
多 电子 产品 的 理想 选择 。 


问题 与 练习 

1. 我 们 可 以 从 加 快 磁盘 或 CD 转速 中 获得 什么 ? 

2. 当 记 录 数 据 到 多 盘 片 存储 系统 时 ,我 们 是 应 该 写 满 一 张 盘 片 后 再 写 另 一 张 盘 片 ， 还 是 应 该 写 满 一 个 柱 
面 后 再 写 另 一 个 柱 面 ? 

3. 为 什么 预订 系统 里 的 那些 需要 经 常 更 新 的 数据 ， 要 存储 在 磁盘 里 ， 而 不 是 CD 或 DVD 里 ? 

4. 哪些 因素 能 使 同一 个 驱动 器 能 读 包含 CD、DVD 以 及 蓝光 光碟 在 内 的 所 有 光碟 ? 

5. 相对 于 本 节 介绍 的 其 他 海量 存储 系统 ， 闪 存 驱 动 器 有 什么 优势? 

6. 让 磁 硬 盘 驱 动 器 仍 具 竞 争 力 的 优势 是 什么 ? 


1.4 ”用 位 模式 表示 信息 


在 研究 了 位 存储 的 技术 后 ， 现 在 来 了 解 如 何 将 信息 编码 为 位 模式 。 我 们 将 集中 学 习 一 些 流 
行 的 文本 编码 方法 、 数 字数 据 编码 方法 、 图 像 编码 方法 以 及 声音 编码 方法 。 其 中 每 一 个 编码 系 
统 都 可 能 会 影响 到 典型 的 计算 机 用 户 。 我 们 的 目标 是 充分 了 解 这 些 技术 ， 以 便 知 道 应 用 这 些 技 
术 的 效果 。 


1.4.1 文本 的 表示 


文本 形式 的 信息 通常 由 一 种 代码 表示 ， 其 中 文本 中 的 每 一 个 不 同 的 符号 (如 英文 字母 和 标 
点 符号 ) 均 被 赋予 唯一 的 位 模式 。 这 样 ， 文 本 就 表示 为 一 个 长 的 位 串 ， 位 串 中 的 连续 位 模式 表 
示 的 是 原文 本 中 的 连续 符号 。 

在 20 世 纪 的 40 年 代 和 50 年 代 ， 人 们 设计 了 许多 这 样 的 代码 ， 并 结合 不 同 的 设备 使 用 ， 随 之 
增加 了 不 少 通信 和 问题。 为 了 缓解 这 种 情况 ， 美 国 国家 标准 化 学 会 American National Standards 
Institute，ANSI， 读 作 “AN-see”) 采用 了 美国 信息 交换 标准 码 (American Standard Code for 
Information Interchange，ASCI)。 这 种 代码 使 用 长 度 为 7 的 位 模式 来 表示 大 小 写 英文 字母 、 标 点 
符号 、 数 字 0 一 9 以 及 某 些 控制 信息 《如 换行 、 回 车 和 制 表 符 )。 后 来 ，ASCII 码 通过 在 每 个 7 位 
位 模式 的 最 高 端 添加 一 个 0， 扩 展 为 8 位 位 模式 。 这 个 技术 不 仅 使 所 产生 的 代码 的 位 模式 与 字 节 
型 存储 单元 相 匹配 ， 而 且 还 提供 了 128 个 附加 位 模式 〈 通 过 给 附加 的 位 赋予 数值 1)， 可 以 表示 除 
英语 字母 和 关联 的 标点 符号 之 外 的 符号 。 
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Wa | 
美国 国家 标准 化 学 会 (ANSI) 成 立 于 1918 年 ， 是 由 一 些 工程 师 协 会 和 政府 机 构 联 合 创 办 
的 非 赢利 性 联盟 ,致力 于 协调 私人 部 门 自发 标准 的 发 展 。 现 在 ,ANSI 成 员 中 有 1300 多 个 企业 、 
专业 组 织 、 行 业 协会 和 政府 机 构 。ANSI 的 总 部 设 在 纽约 ， 它 是 美国 在 ISO 的 代表 。 它 的 网 站 
是 http://www.ansi.org,。 | 
其 他 国家 的 类 似 组 织 包 括 澳大利亚 标准 组 织 ( Standards Australia )、 加 拿 大 标准 委员 会 
( Standards Council of Canada )、 中 国 国家 质量 技术 监督 局 ( China State Bureau of Quality and 
Technical Supervision )、 德 国标 准 化 学 会 (Deutsches Institut fir Normung )、 日 本 工业 标准 调 
查 会 ( Japanese Industrial Standards Committee )、 墨 西 哥 标准 指导 委员 会 (Direccin General de 
Normas )、 俄 罗斯 联邦 国家 标准 和 度量 委员 会 ( State Committee of the Russian Federation for 
Standardization and Metrology )、 瑞 士 标准 化 协会 (Swiss Association for Standardization ) 和 英 
国标 准 学 会 (British Standards Institution )。 


8 位 位 模式 的 一 部 分 ASCII 码 可 见 附 录 A。 利 用 这 个 附录 ， 我 们 可 以 将 位 模式 


01001000 01100101 01101100 01101100 01101111 00101110 


解码 为 报 文 “Hello.”， 如 图 1-11 所 示 。 















图 1-11 报 文 “Hello.” 的 ASCII 或 UTF-8 编 码 


国际 标准 化 组 织 (International Organization for Standardization ) 简称 IO， 这 个 简称 来 源 于 
希腊 语 中 的 “isos” 一 词 ， 意 思 是 平等 。ISO 开 发 了 大 量 的 ASCII 扩 展 ， 每 种 扩展 都 是 针对 某 一 
主要 语种 设计 的 。 例 如 ， 其 中 一 个 标准 提供 了 表达 大 部 分 西欧 语言 文本 所 需 的 符号 。 在 其 128 
个 附加 模式 中 ， 有 表示 英 磅 和 德语 元 音 i、5、i 的 符号 。 






国际 标准 化 组 织 ( 常 称 为 SO ) 建立 于 1947 年 ， 是 一 个 由 各 国标 准 化 团体 组 成 的 世界 范 
围 的 联合 会 。 现 如 今 ， 它 的 总 部 设 在 瑞士 日 内 瓦 ， 有 100 多 个 成 员 团 体 和 许多 通信 成 员 。 (一 
个 通信 成 员 通常 是 一 个 国 家 的 标准 化 团体 , 这 个 国家 还 没有 国家 认可 的 标准 化 团体 这 些 成 员 
不 能 直接 参与 标准 的 开发 ， 但 可 以 了 解 ISO 的 活动 . ) ISO 的 网 站 是 http://www.iso.org。 


ISO 扩展 的 ASCII 标 准 在 支持 全 世界 多 语言 通信 方面 取得 了 巨大 进展 , 但 是 仍 有 两 个 主要 
障碍 。 首 先 ， 扩 展 的 ASCII 中 额外 可 用 的 位 模式 数 不 足 以 容纳 许多 亚洲 语言 和 一 些 东欧 语言 的 
字母 表 。 其 次 ， 因 为 一 个 特定 文档 只 能 使 用 一 个 选 定 标 准 中 的 符号 ， 所 以 无 法 支持 包含 不 同 语 
种 的 语言 文本 的 文档 。 实 践 证 明 ， 这 两 者 都 会 严重 妨碍 其 国际 化 使 用 。 为 弥补 这 一 不 足 ，Unicode 
在 一 些 主要 软 硬 件 厂 商 的 合作 下 诞生 了 ， 并 迅速 赢得 了 计算 界 的 支持 。 这 种 代码 采用 唯一 的 21 
位 模式 来 表示 每 一 个 符号 。 当 Unicode 字 符 集 与 Unicode 转 换 格式 8 位 〈Unicode transformation 
format 8-bit，UTF-8) 编码 标准 结合 在 一 起 时 ， 原 来 的 ASCII 字 符 仍然 可 以 用 8 位 来 表示 ， 而 像 
汉语 、 日 语 和 希 伯 来 语 这 样 的 语言 所 产生 的 数 以 千 计 的 其 他 字符 则 可 以 用 16 位 来 表示 。 除 了 可 
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以 表示 世界 上 所 有 常用 语言 所 需 的 字符 以 外 ，UTF-8 的 24 位 或 32 位 模式 还 可 以 表示 比较 鲜 为 人 
知 的 Unicode 符 号 ， 为 未 来 的 扩展 留 出 了 充足 的 空间 。 

由 一 长 串 根据 ASCII 或 Unicode 编 码 的 符号 组 成 的 文件 常 称 为 文本 文件 (text file)。 区 分 下 面 
两 类 文件 很 重要 : 一 类 是 由 称 为 文本 编辑 器 (text editor， 常 简称 为 编辑 器 ) 的 实用 程序 操作 的 
简单 文本 文件 ; 一 类 是 由 字 处 理 程序 (word processor)， 如 微软 的 Word， 产 生 的 较 复杂 的 文件 。 
两 者 都 是 由 文本 材料 组 成 的 ， 但 是 ， 文 本 文件 只 包含 文本 中 各 个 字符 的 编码 ， 而 由 字 处 理 程 序 
产生 的 文件 还 包含 许多 表示 字体 变化 、 对 齐 信 息 和 其 他 参数 的 专 有 代码 。 


1.4.2 ”数值 的 表示 


当 所 记录 的 信息 只 有 数值 时 ， 以 字符 编码 的 形式 存储 信息 效率 就 会 很 低 。 为 了 了 解 其 中 的 
原因 ， 让 我 们 来 看 看 数值 25 的 存储 问题 。 如 果 我 们 坚持 用 ASCII 编 码 符号 来 存储 ， 每 个 符号 一 
个 字 节 ， 那 么 总 共 需 要 16 个 二 进 制 位 。 此 外 ， 用 16 个 二 进 制 位 可 以 存储 的 最 大 数 是 99。 不 过 ， 
我 们 马上 就 可 以 看 到 ， 使 用 二 进 制 记 数 法 (binary notation)，16 个 二 进 制 位 可 以 存储 0 一 65 535 
范围 内 的 任何 一 个 整数 。 因 此 ， 二 进 制 记 数 法 (或 它 的 变 体 ) 被 广泛 应 用 于 计算 机 存储 器 中 
数值 数据 的 编码 。 

二 进 制 记 数 法 是 一 种 数值 表示 方法 ， 只 使 用 数字 0 和 1， 区 别 于 传统 的 使 用 数字 0、1、2、 
3、4、5、6、7、8 和 9 的 十 进 制 记 数 系统 。 我 们 将 在 1.5 节 中 更 详细 地 学 习 二 进 制 系统 ， 现 在 
只 需要 初步 了 解 该 系统 。 我 们 来 考虑 一 种 老式 的 汽车 里 程 表 ， 它 的 显示 轮 只 包含 数字 0 和 1， 
而 不 是 传统 的 十 进 制 数字 0 一 9。 里 程 表 以 全 0 读数 开始 ， 在 汽车 行驶 的 前 几 英里 ， 最 右 方 的 
滚动 显示 轮 从 0 旋转 至 1; 当 这 个 1 旋转 回 0 时 ， 会 使 其 左边 出 现 一 个 1， 产 生 模 式 10; 接着 ， 
右边 的 0 旋转 至 1， 产 生 模 式 11; 现在 ， 最 右边 的 数 从 1 旋转 回 0， 使 得 它 左边 的 1 也 旋转 回 0， 
这 就 使 另 一 个 1 出 现在 第 3 位 上 ， 产 生 模 式 100。 简 言 之 ， 在 我 们 驾驶 汽车 时 ， 将 看 到 下 列 顺 
序 的 里 程 表 读 数 : 

0000 

0001 

0010 

0011 

0100 

0101 

0110 

OTL 

1000 


这 个 序列 包括 了 整数 0 一 8 的 三 进 制 表示 。 尽 管 这 种 计数 技术 有 些 匈 长 乏味 ， 但 是 我 们 可 以 
扩展 它 ， 发 现 16 个 1 组 成 的 位 模式 是 可 以 表示 数值 65 535 的 ， 这 就 证 实 了 我 们 的 说 法 : 0 一 65 535 
范围 内 的 任何 整数 都 可 以 利用 16 个 二 进 制 位 进行 编码 。 

由 于 它 的 高 效 性 ， 数 字 信息 通常 使 用 某 种 形式 的 二 进 制 记 数 法 来 存储 ， 而 不 用 编码 符号 。 
我 们 之 所 以 说 “ 某 种 形式 的 二 进 制 记 数 法 ” 是 因为 上 面 描述 的 简单 二 进 制 系统 只 是 机 器 里 应 用 
的 若干 数值 存储 技术 的 基础 。 本 章 后 面 会 讨论 一 些 二 进 制 系统 的 变 体 。 现 在 我 们 只 需要 知道 ， 
称 为 二 进 制 补 码 (two’s complement) 记 数 法 〈 见 1.6 节 ) 的 系统 通常 用 于 存储 整数 ， 因 为 它 提 供 
了 一 种 便利 的 表示 负数 和 正 数 的 方法 。 为 了 表示 4 或 了 这 样 带 有 分 数 部 分 的 数 ， 我 们 还 要 使 


用 一 种 称 为 浮 点 记 数 法 (floating-point notation) 的 技术 〈 见 1.7 节 )。 
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1.4.3 图像 的 表示 


图 像 的 一 种 表示 方法 是 : 将 图 像 解 释 为 一 组 点 ， 每 一 个 点 称 为 一 个 像素 (pixel， 是 picture 
element 的 简写 ); 然后 ， 对 每 个 像素 的 显示 进行 编码 ， 整 个 图 像 就 表示 成 了 这 些 编码 像素 的 集 
合 ， 这 个 集合 被 称 为 位 图 (bit map)。 这 种 方法 很 常用 ， 因 为 许多 显示 设备 (如 打印 机 和 显示 器 ) 
都 是 基于 像素 概念 操作 的 。 因 此 ， 位 图 格式 的 图 像 更 便于 格式 化 显示 。 

位 图 中 的 像素 编码 方式 随 着 应 用 的 不 同 而 不 同 。 对 于 简单 的 黑白 图 像 , 每 个 像素 由 一 个 位 表示 ， 
位 的 值 取决 于 相对 应 像素 是 黑 还 是 白 。 这 是 大 多 数 传真 机 采用 的 方法 。 对 于 更 加 精致 的 黑白 照片 ， 
每 个 像素 由 一 组 位 (通常 是 8 个 ) 表示 ， 这 使 得 许多 灰色 阴影 也 可 以 表示 出 来 。 对 于 彩色 图 像 ， 每 
个 像素 通过 更 为 复杂 的 系统 来 编码 。 有 两 种 方法 很 常用 ， 其 中 一 种 是 RGB 编码 ， 每 个 像素 表示 为 3 
种 颜色 成 分 一 一 红 、 绿 、 蓝 ， 它 们 分 别 对 应 于 光线 的 三 原色 。 每 一 种 颜色 成 分 的 强度 一 般 是 用 一 个 
字 节 来 表示 。 因 此 ， 要 表示 原始 图 像 中 的 一 个 单独 像素 ， 就 需要 3 个 字 节 的 存储 空间 。 

另 一 种 奉 代 简单 RGB 编码 的 方法 是 ， 使 用 一 个 “亮度 ”成 分 和 两 个 颜色 成 分 。 在 这 种 方法 
中 ,“ 亮 度 ” 成 分 被 称 为 像素 亮度 ， 基 本 上 就 是 红 、 绿 、 蓝 三 种 颜色 成 分 的 总 和 。 (事实 上 ， 它 
是 像素 中 白光 的 数量 ， 但 是 现在 我 们 不 需要 考虑 这 些 细节 。) 其 他 两 种 成 分 ， 称 为 蓝 色色 度 和 红 
色色 度 , 分别 由 像素 中 的 像素 亮度 与 蓝 或 红 光 数量 之 间 的 差 来 决定 。 这 3 个 成 分 合 在 一 起 就 是 再 
现 这 个 像素 所 需要 的 全 部 信息 。 

利用 亮度 和 色 度 成 分 进行 图 像 编 码 这 种 方式 的 普及 源 自 彩色 电视 广播 领域 ， 因 为 这 种 方法 
提供 的 彩色 图 像 编 码 方式 可 以 兼容 老式 黑白 电视 接收 器 。 事 实 上 ， 只 需要 利用 编码 彩色 图 像 的 
亮度 成 分 就 可 以 制造 出 图 像 的 灰 度 版 本 。 

用 位 图 表示 图 像 的 缺点 在 于 ， 图 像 不 能 轻易 调整 到 任意 大 小 。 基 本 上 ， 放 大 图 像 的 唯一 途 
径 就 是 变 大 像素 ， 而 这 会 使 图 像 模 糊 。( 这 就 是 应 用 于 数字 照相 机 的 “数字 变焦 ”技术 ， 与 此 相 
对 的 “光学 变焦 ”是 通过 调整 照相 机 镜头 实现 的 。) 

图 像 的 另外 一 种 表示 方法 ， 和 避免 了 这 个 缩放 问题 ， 将 图 像 描 述 成 了 几何 结构 (如 直线 和 曲 
线 ) 的 集合 ， 这 些 几 何 结构 可 以 用 解析 几何 技术 来 编码 。 这 种 描述 允许 最 终 显示 图 像 的 设备 决 
定 几 何 结 构 的 显示 方式 ， 而 不 是 让 设备 再 现 特殊 像素 模式 。 这 种 方法 被 用 在 了 当今 的 字 处 理 系 
统 中 ， 用 于 产生 可 缩放 的 字体 。 例 如 ，TrueType( 由 微软 公司 和 苹果 公司 开发 ) 是 用 几何 结构 
描述 文本 符号 的 系统 ， 而 PostScript〈( 由 Adobe 系 统 开发 ) 提供 了 一 种 描述 字符 及 更 一 般 的 图 形 
数据 的 方法 。 这 种 表示 图 像 的 几何 方法 在 计算 机 辅助 设计 (computer-aided design，CAD) 系统 
中 也 很 常见 ， 用 于 在 计算 机 屏幕 上 显示 和 操控 三 维 物体 的 绘制 。 

许多 绘图 软件 系统 (如 微软 的 画图 工具 ) 都 允许 用 户 用 预先 设 定 的 形状 〈 如 矩形、 椭圆 形 、 
基本 线条 等 ) 画图 ， 对 于 这 些 用 户 来 说 ， 用 几何 结构 表示 图 像 与 用 位 图 表示 图 像 之 间 的 区 别 是 
很 明显 的 。 用 户 只 需 从 菜单 中 选择 所 需 的 几何 形状 ， 就 可 以 用 鼠标 绘制 出 形状 。 在 绘制 过 程 中 ， 
软件 保存 了 所 画 形状 的 几何 描述 。 当 鼠标 给 出 方向 后 ， 内 部 的 几何 表示 就 被 修改 ， 再 转化 成 位 
图 形式 显示 出 来 。 这 种 方法 方便 图 像 的 缩放 和 形状 的 改变 。 然 而 ， 一 旦 绘制 过 程 完成 ， 系 统 就 
会 去 除 基 本 的 几何 描述 ， 仅 保存 位 图 ， 这 意味 着 ， 再 做 其 他 修改 需要 经 历 匈 长 的 一 个 像素 接 一 
个 像素 的 修改 过 程 。 另 外 ， 一 些 绘图 系统 会 将 描述 作为 几何 图 形 保存 下 来 ， 并 允许 在 之 后 进行 
修改 。 有 了 这 些 系统 ， 就 可 以 轻松 地 调整 图 形 的 大 小 ， 并 可 按 各 种 尺寸 显示 清晰 图 像 。 


1.4.4 声音 的 表示 


为 了 便于 计算 机 存储 和 操作 ， 对 音频 信息 进行 编码 的 最 常用 方法 是 ， 按 有 规律 的 时 间 间 隔 
对 声波 的 振幅 采样 ， 并 记录 所 得 到 的 数值 序列 。 例 如 ， 序 列 0、1.5、2.0、1.5、2.0、3.0、4.0、 
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3.0、0 可 以 表示 这 样 一 种 声波 : 它 的 振幅 先 增 大 ， 然 后 经 短暂 的 减 小 ， 再 回升 至 较 高 的 幅度 ， 
接着 又 减 回 至 0 〈 见 图 1-12)。 这 种 技术 采用 每 秒 8000 次 的 采样 频率 ， 已 经 在 远程 语音 电话 通信 
中 使 用 了 许多 年 。 通 信 一 端的 语音 被 编码 为 数字 值 ， 表 示 每 秒 8000 次 的 声音 振幅 。 接 着 ， 这 些 
数字 值 通过 通信 线路 被 传输 到 接收 端 ， 用 来 重 现 声 音 。 


编码 的 声波 





0 15 2.0 15 2.0 3.0 4.0 3.0 0 
振幅 
图 1-12 序列 0、1.5、2.0、1.5、2.0、3.0、4.0、3.0、0 所 表示 的 声波 


尽管 每 秒 8000 次 的 采样 频率 似乎 是 很 快 的 速率 , 但 它 还 是 满足 不 了 音乐 录制 的 高 保 真 需求 。 
为 了 实现 现在 音乐 CD 重 现 声音 的 质量 ， 我 们 需要 采用 每 秒 44 100 次 的 采样 频率 。 每 次 采样 得 到 
的 数据 要 用 16 位 的 形式 表示 〈32 位 用 于 立体 声 录 制 )。 因 此 ， 录 制 成 立体 声 的 音乐 ， 每 一 秒 需要 
100 多 万 个 存储 位 。 

乐器 数字 化 接口 (musical instrument digital interface，MIDI， 读 作 “MID-ee”) 是 另外 一 种 
编码 系统 ， 被 广泛 用 于 电子 键盘 的 音乐 合成 器 、 视 频 游戏 声音 ， 以 及 网 站 的 辅助 音效 。MIDI 
是 在 合成 器 上 编码 产生 音乐 的 指令 ， 而 不 是 对 音乐 本 身 进行 编码 ， 因 此 它 避 免 了 采样 技术 那样 
的 大 存储 容量 要 求 。 更 精确 地 说 ，MIDI 是 对 什么 乐器 演奏 什么 音符 以 及 持续 时 间 进 行 编 码 。 
例如 ， 单 纂 管 演奏 DD 音符 2 秒 ， 可 以 编码 为 3 个 字 节 ， 而 不 必 按 照 每 秒 44 100 次 的 采样 频率 用 两 
百 多 万 个 二 进 制 位 来 编码 。 

简 言 之 , 可 以 把 MIDI 看 作 是 对 演奏 者 乐谱 编码 的 一 种 方法 ， 而 不 是 对 演奏 本 身 编 码 。 因 此 
MIDI“ 录 制 ” 的 音乐 在 不 同 合成 器 上 演奏 时 声音 可 能 是 截然 不 同 的 。 


问题 与 练习 
1. 下 面 是 用 ASCI 编 码 的 一 条 消息 ， 每 个 符号 8 位 。 它 的 含义 是 什么 ? 《〈 见 附录 A) 
01000011 0i101111 01101101 01110000 01110101 01110100 01100101 


， .01110010 00100000 01010011 01100011 01101001 01100101 01101110 
01100011 01100101 


2. 在 ASCII 码 中 ， 大 写字 母 码 和 相应 小 写字 母 码 之 间 的 关系 是 什么 ? ( 见 附录 A) 
3. 用 ASCII 对 下 列 语句 编码 : 
a. “Stop!” Cheryl shouted. 
b. Does 2+3=5? 
描述 一 种 在 日 常生 活 中 能 够 时 现 两 种 状态 的 设备 ， 例如 ， 旗 杆 上 的 旗帜 ， 或 者 升 起 或 者 降下 。 给 一 种 
状态 赋值 1， 另 一 种 赋值 0， 请 说 明 当 以 这 样 的 位 来 存储 时 ， 字 母 b 的 ASCII 码 会 怎样 表示 ? 
5. 将 下 列 三 进 制 表示 分 别 转化 为 相应 的 十 进 制 形式 。 
a. 0101 b. 1001 €. LO d.0110 e,10000 f.10010 
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6. 将 下 列 的 十 进 制 表示 分 别 转化 为 相应 的 二 进 制 形式 。 

a.6 b. 13 c.11 d. 18 e.27 f.4 

7. 如 果 每 个 数字 采用 每 字 节 一 个 ASCH 码 的 模式 编码 ， 那 么 3 个 字 节 可 以 表示 的 最 大 数字 值 是 多 少 ? 如 
果 采 用 二 进 制 编码 ， 那 么 又 能 够 表示 多 大 的 数字 值 ? 

8. 除 十 六 进 制 记 数 法 以 外 ， 另 一 种 表示 位 模式 的 方法 是 点 分 十 进 制 记 数 法 (dotted decimal notation )， 其 
中 每 个 字 节 由 相对 应 的 十 进 制 数 来 表示 ， 而 且 这 些 字 节 表示 之 间 是 用 句点 分 开 的 。 例 如 ，12.5 表 示 模 
式 0000110000000101 ( 12 表示 字 节 00001100，5 表 示 字 节 00000101 ) ， 而 136.16.7 表 示 模 式 
100010000001000000000111。 用 点 分 十 进 制 记 数 法 表示 下 列 位 模式 : 

a. 0000111100001111 b. 001100110000000010000000 
c. 0000101010100000 

9. 相对 于 位 图 技术 ， 用 几何 结构 表示 图 像 有 哪些 优点 ? 位 图 技术 相对 于 几何 结构 又 有 哪些 优点 ? 

10. 假 如 采用 文中 所 讨论 的 每 秒 44 100 次 的 采样 频率 ， 对 1 小 时 音乐 的 立体 声 录 音 进 行 编码 。 请 问 这 段 音 
乐 编 码 的 大 小 与 CD 的 存储 容量 相 比 结果 如 何 ? 


ep- er ER £m EE tee i ee IF ete VE 0 rE E54 eH pee este 
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在 1.4 节 中 我 们 看 到 ， 二 进 制 记 数 法 是 表示 数字 值 的 一 种 方法 ， 它 只 使 用 数字 0 和 1， 而 不 用 
较 常 见 的 十 进 制 记 数 系统 中 的 10 个 数字 0 到 9。 现 在 ， 我 们 来 深入 了 解 一 下 二 进 制 记 数 法 。 
1.5.1 二 进 制 记 数 法 

回顾 十 进 制 系统 ,表示 中 的 每 一 个 位 置 都 与 一 个 量 值 相 关联 。 在 375 这 个 表示 中 ，5 的 位 
置 与 量 1 相 关联 ，7 的 位 置 与 量 10 相 关联 ，3 的 位 置 与 量 100 相 关联 ( 见 图 1-13a)。 每 一 个 量 值 
是 它 右边 量 值 的 10 倍 。 整 个 表达 式 代 表 的 数值 是 , 每 一 个 数字 值 与 其 位 置 的 量 值 相 乘 所 得 积 


之 和 。 举 例 说 明 : 模式 375 表 示 (3x100) + (7x10) + (5x1)， 用 更 加 技术 性 的 表示 法 表示 
就 是 (3x102) + (7x10') + (5x10°)。 





于 加 同上] 表示 1011 上 表示 
S/S | 位 置 的 量 人 fs 上 ea 
(a) 十 进 制 (b) 二 进 制 


图 1-13 ”十进制 和 二 进 制 系统 


在 二 进 制 记 数 法 中 ， 每 个 数字 的 位 置 也 与 一 个 量 值 相关 联 ， 只 是 与 每 个 位 置 相 关联 的 那个 量 值 
是 它 右边 量 值 的 两 倍 。 更 精确 地 说 ， 在 二 进 制 表示 中 ， 最 右边 的 数字 与 量 值 1 ( 即 2") 相关 联 ， 其 左 
边 的 下 一 个 位 置 与 量 值 2>( 即 21〉 相 关联 ， 下 一 个 与 量 值 4( 即 2*) 相关 联 ， 再 下 一 个 与 量 值 8( 即 23) 
相关 联 ， 依 次 类 推 。 例 如 ， 在 二 进 制 表示 1011 中 ， 最 右边 1 的 位 置 与 量 值 1 相关 联 ， 接 下 来 一 个 1 的 
位 置 与 量 值 2 相关 联 ，0 的 位 置 与 量 值 4 相关 联 ， 最 左边 1 的 位 置 与 量 值 8 相关 联 ( 见 图 1-13b)。 

为 了 求 得 二 进 制 表 示 所 表示 的 数值 ， 我 们 可 以 采取 和 十 进 制 相 同 的 步骤 : 先 求 得 每 个 数字 值 与 其 
量 值 的 积 ， 再 计算 各 个 乘积 之 和 。 例 如 ，100101 表 示 的 数值 是 37， 如 图 1-14 所 示 。 需 要 注意 的 是 ， 因 
为 二 进 制 记 数 法 仅 使 用 数字 0 和 1， 这 种 求 积 再 求 和 的 步骤 就 可 以 简化 为 求 数字 值 为 1 的 位 置 对 应 的 量 
值 的 和 。 因 此 ， 二 进 制 模式 1011 表 示 的 是 十 进 制 数值 11， 因 为 3 个 1 的 位 置 分 别 与 量 值 1、2 和 8 相关 联 。 
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二 进 制 模式 十 岂 





TT 
位 的 值 位 置 的 量 值 
图 1-14 ”二进制 表示 100101 的 解码 


， 在 1.4 节 中 ， 我 们 学 习 了 如 何 用 二 进 制 记 数 法 计数 ， 这 就 使 得 我 们 可 以 对 小 整数 进行 编码 。 
为 了 求 得 大 数值 的 二 进 制 表 示 ， 你 可 能 更 倾向 于 图 1-15 所 描述 的 算法 。 让 我 们 利用 这 个 算法 来 
求 十 进 制 数 值 13 的 二 进 制 表 示 《〈 见 图 1-16)。 首 先 ， 将 13 除 以 2， 得 到 商 数 6 和 余数 1。 因 为 这 个 
商 不 是 0， 步 骤 2 告 诉 我 们 还 要 在 商 数 (6) 的 基础 上 除 以 2， 得 到 新 的 商 数 3 和 余数 0。 最 新 的 商 
数 仍然 不 为 0， 所 以 再 除 以 2， 得 出 商 数 1 和 余数 1。 再 一 次 ， 将 最 新 的 商 数 (1) 除 以 2， 此 时 得 
到 商 数 0 和 余数 1。 因 为 现在 的 商 数 是 0， 我 们 进入 步骤 3， 从 余数 列 中 得 到 原 数 〈13) 的 二 进 制 
表示 1101。 , 


步骤 1 将 该 值 除 以 ， 记 下 余数 。 


步骤 2 只 要 所 得 的 商 不 是 零 ， 就 继续 将 最 新 的 商 除 以 2， 并 记 下 余数 。 
步骤 3 商 为 0 时 ， 将 余数 按 所 记录 的 顺序 从 右 到 左 依次 排列 ， 即 得 到 原 数 的 二 进 制 表 示 。 





图 1-15 求 正 整数 二 进 制 表 示 的 算法 





1 1 0 1 二 进 制 表 示 
图 1-16 利用 图 1-15 的 算法 求 13 的 二 进 制 表 示 


1.5.2 二进制 加 法 


为 了 理解 两 个 用 二 进 制 表示 的 整数 的 相 加 过 程 ， 首 先 让 我 们 回顾 一 下 用 传统 十 进 制 记 数 法 
表示 的 数值 的 相 加 过 程 。 例 如 ， 考 虑 下 面 的 问题 : 
58 
土 27 


我 们 先 把 最 右 列 的 8 和 7 相 加 ， 得 到 和 15， 我 们 把 5 记录 在 这 一 列 的 底部 ， 进 位 1 放 到 下 一 列 中 ， 得 到 ; 
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部 ， 得 到 : 





总 之 ， 这 个 过 程 就 是 从 右 到 左 相 加 每 一 列 中 的 数字 ， 把 和 中 的 最 低 有 效 位 写 在 列 的 底部 ， 把 和 
的 较 高 有 效 位 〈 如 果 有 ) 进位 到 下 一 列 。 
为 了 将 两 个 用 二 进 制 表示 的 正 整 数 相 加 ， 我 们 遵照 相同 的 过 程 ， 只 是 所 有 和 的 计算 都 使 用 
图 1-17 中 显示 的 加 法 规则 ， 而 不 是 你 在 小 学 所 学 的 传统 的 十 进 制 加 法 法 则 。 例 如， 为 了 解决 问题 : 
111010 
二 41011 
首先 将 最 右边 的 0 和 1 相 加 ， 得 到 1， 写 于 该 列 下 方 。 接 着 将 下 一 列 的 1 和 1 相 加 ， 得 到 10。 把 其 中 
的 0 写 于 该 列 下 方 ， 将 1 记 在 了 下 一 列 的 上 面 。 这 时 ， 加 法 如 下 : 
i 
111010 


+ 11011 
01 


把 下 一 列 的 1、0 和 0 相 加 ， 得 到 1， 将 1 写 于 该 列 下 方 。 下 一 列 的 1 和 1 总 和 为 10， 将 0 写 于 该 列 下 
上 
111010 
wo 
0101 
下 一 列 的 1、1 和 1 总 和 为 11 (数值 3 的 二 进 制 表 示 )， 将 低位 1 写 于 该 列 下 方 ， 并 将 另外 一 个 1 写 在 
下 一 列 的 上 面 。 把 那个 1 与 那 列 原本 的 1 相 加 ， 得 到 10。 再 一 次 ， 在 该 列 下 方 写 下 低位 0， 并 将 1 
写 在 下 一 列 的 上 面 。 现 在 得 到 
1 
111010 
老 ， 才 二 全 二 二 
010101 
下 一 列 的 唯一 项 就 是 1， 是 上 一 列 进 过 来 的 ， 所 以 我 们 将 其 记录 为 答案 。 最 终 的 结果 是 : 
111010 


在 于 OW 
1010101 








图 1-17 二 进 制 加 法 法 则 
1.5.3 二进制 中 的 小 数 


为 了 扩展 二 进 制 记 数 法 ， 使 其 包含 小 数 数值 ， 我 们 使 用 了 小 数 点 〈radix point)， 其 功能 与 
十 进 制 记 数 法 中 的 十 进 制 小 数 点 是 相同 的 ， 即 小 数 点 左边 的 数字 代表 数值 的 整数 部 分 〈 整 个 部 
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分 )， 其 解释 和 前 面 讨论 的 二 进 制 系统 一 样 。 小 数 点 右边 的 数字 代表 数值 的 小 数 部 分 ， 其 解释 和 
其 他 二 进 制 位 类 似 ， 只 是 它们 的 位 置 被 赋予 了 小 数 的 量 值 。 更 确切 地 说 ， 小 数 点 右边 第 一 位 的 
量 值 是 了 即 21)， 下 一 位 的 量 值 是 了 〈 即 2?)， 再 下 一 位 是 《 即 23)， 依 次 类 推 。 需 要 注意 
的 是 ， 这 仅仅 是 前 面 所 述 规则 的 延续 ， 即 每 位 所 被 赋予 的 量 值 是 它 右边 大 小 的 两 倍 。 利 用 这 些 


赋予 二 进 制 位 位 置 的 量 值 ， 对 包含 小 数 点 和 不 包含 小 数 点 的 二 进 制 表示 进行 解码 的 步骤 基本 是 
相同 的 。 更 精确 地 说 ， 我 们 是 把 表示 中 每 一 个 位 值 与 其 对 应 位 位 置 的 量 值 相 乘 。 举 例 来 说 ， 二 


进 制 表示 101.101 的 解码 为 5 ， 如 图 1-18 所 示 。 


二 进 制 模式 十 出 序 有 划 有 芹 





位 的 值 位 置 的 量 值 


图 1-18 ”二进制 表示 101.101 的 解码 
另外 ， 应 用 于 十 进 制 系统 的 加 法 技术 同样 适用 于 二 进 制 系统 ， 即 两 个 有 小 数 点 的 二 进 制 表 
示 相 加 时 ,我们 只 需要 对 齐 小 数 点 ， 然 后 应 用 前 面 介绍 的 加 法 步骤 进行 计算 即 可 。 例 如 ，10.011 
加 100.11 得 111.001， 如 下 所 示 : 


10.011 
0 
43111001 
问题 与 练习 
1. 将 下 列 二 进 制 表示 转换 为 相应 的 十 进 制 形式 。 
a LOLOLTO b. 100001 ' eC LO0LLL dr QLd Br 
2. 将 下 列 十 进 制 表示 转换 为 相应 的 二 进 制 形式 。 
a 32 b. 64 c. 96 ds 6€.27 
3. 将 下 列 二 进 制 表 示 转 换 为 相应 的 十 进 制 形式 。 
a 11:01 b. 101.111 © Os d.110.011 e.0.101 
4. 用 二 进 制 记 数 法 表示 下 列 数值 。 
站 吉大 和 1 吕 5 
如 4 村 b. 2 C. 1 d. 16 €. a 
5. 按照 二 进 制 记 数 法 做 下 列 加 法 。 
a. 11011 Bi0L000L C. 1 dw elle 
+ “11400 于 昌平 + 0001 十 00.01 


me ee 一 一 me ee - 一 一 =“ ~ ~ ar- 一 -一 
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数学 家 们 长 久 以 来 就 对 数字 记 数 系统 很 感 兴趣 ， 而 且 他 们 的 许多 想法 已 经 被 证 明 与 数字 电 
路 的 设计 是 相符 的 。 本 节 ， 我 们 将 研究 其 中 两 种 记 数 系统 : 二 进 制 补 码 记 数 法 和 余 码 记 数 法 。 
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它们 都 是 计算 设备 用 于 表示 整数 的 方法 。 虽 然 这 些 系统 都 是 基于 二 进 制 系统 的 ， 但 是 它们 增加 
了 一 些 其 他 的 特性 ， 因 而 与 计算 机 设计 更 加 兼容 。 尽 管 它 们 有 这 么 多 的 优点 ， 但 是 它们 也 有 缺 
点 。 我 们 的 目标 是 了 解 这 些 特 性 以 及 它们 是 如 何 影 响 计 算 机 用 法 的 。 






1.6.1 二 进 制 补 码 记 数 法 

现今 计算 机 中 最 流行 的 整数 表示 系统 是 二 进 制 补 码 (two's complement) 记 数 法 。 这 个 系统 
采用 固定 数目 的 二 进 制 位 来 表示 系统 中 的 每 一 个 数值 。 现 今 设备 中 普遍 采用 二 进 制 补 码 系统 ， 
其 中 每 个 数值 用 一 个 32 位 的 模式 表示 。 这 种 大 系统 能 表示 很 大 范围 的 数字 ， 但 不 方便 演示 。 
此 ， 在 学 习 二 进 制 补 码 系 统 的 特性 时 ， 我 们 将 着 重 介绍 较 小 的 系统 。 

图 1-19 列 出 了 两 种 完整 的 二 进 制 补 码 系统 ， 一 种 基于 长 度 为 3 的 位 模式 ， 另 一 种 基于 长 度 为 
4 的 位 模式 。 要 构造 这 种 系统 ， 首 先 要 规定 一 组 适当 长 度 的 二 进 制 0， 接 着 用 二 进 制 计数 ， 直 到 
只 有 一 个 0、 其 他 都 是 1 的 模式 形成 。 这 些 模式 表示 数值 0, 1, 2, 3，…。 要 想 获得 表示 负 值 的 模式 ， 
首先 要 规定 一 组 适当 长 度 的 二 进 制 1， 接 着 按照 三 进 制 反 向 计数 ， 直 到 只 有 一 个 1、 其 他 都 是 0 
的 模式 形成 。 这 些 模式 表示 数值 -1， -2， -3，…。( 如 果 你 认为 利用 二 进 制 反 向 计数 有 困难 ， 那 
么 可 以 从 表格 底部 只 有 一 个 1、 其 他 都 为 0 的 模式 开始 ， 向 上 计数 到 全 是 1 的 模式 。) 





(a) 使 用 长 度 为 3 的 位 模式 (b) 使 用 长 度 为 4 的 位 模式 
图 1-19 ”二进制 补 码 记 数 法 系统 
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注意 , 在 二 进 制 补 码 系 统 中 , 位 模式 最 左边 的 二 进 制 位 指明 了 所 表示 的 数值 的 符号 。 因 此 ， 
最 左边 的 位 常 称 为 符号 位 (sign bit)。 在 二 进 制 补 码 系统 中 ， 符 号 位 为 1 的 模式 表示 负 值 ， 符 号 
位 为 0 的 模式 表示 非 负 值 。 

在 二 进 制 补 码 系统 中 ， 绝 对 值 相 同 的 正 负数 值 的 表示 模式 之 间 有 一 种 对 应 关系 ， 从 右 向 左 
读 时 ， 直 到 第 一 个 二 进 制 1 (包括 )， 它 们 都 是 相同 的 。 然 后 ， 以 这 个 1 为 分 界线 ， 左 面 的 位 模式 
互 为 补 码 。 要 得 到 一 个 模式 的 补 码 complement)， 需 要 将 所 有 的 二 进 制 0 转 换 为 1， 并 将 所 有 的 
二 进 制 1 转换 为 0。 例 如 ， 图 1-19 中 的 4 位 系统 ， 表 示 2 和 -2 的 模式 都 是 以 10 结 束 ， 但 是 表示 2 的 模 
式 开 始 为 00， 而 表示 -2 的 模式 开始 为 11。 观 察 到 这 一 点 ， 我 们 就 可 以 得 出 在 绝对 值 相同 的 、 表 
示 正 负 值 的 位 模式 之 间 进 行 转换 的 算法 。 我 们 只 需要 从 右 到 左 复制 原始 的 模式 直到 第 一 个 1, 接 
着 在 将 剩余 位 转换 为 最 终 位 模式 时 ， 对 这 些 剩 余 位 取 反 《图 1-20 )。 


用 4 位 二 进 制 补 码 十 0 
记 数 法 表示 6 


从 右 到 左 复制 位 


1 
1 
1 
| 
| 
| 
1 
| 了 
1 直到 一 个 1 被 复制 
| 
1 
1 
1 





余下 的 位 取 反 


4 — 一 一 一 一 一 一 一 一 一 一 一 一 一 





v 
用 4 位 二 进 制 补 码 一 一 [1 0 
记 数 法 表示 -6 

图 1-20 用 4 位 二 进 制 补 码 记 数 法 对 数值 6 编码 


理解 了 三 进 制 补 码 系统 的 这 些 基本 特性 ， 还 可 以 得 出 二 进 制 补 码 表示 法 的 一 个 解码 算法 。 
如 果 要 解码 的 模式 有 一 个 符号 位 0, 我 们 仅仅 需要 读 出 这 个 数值 ， 就 好 像 这 个 模式 是 一 个 二 进 制 
表示 。 例 如 ，0110 表 示 十 进 制 数值 6， 因 为 110 是 6 的 二 进 制 表示 。 如 果 要 解码 的 模式 有 一 个 符号 
位 1， 我 们 就 知道 表示 的 数值 是 负 的 ， 而 我 们 所 要 做 的 就 是 找到 其 绝对 值 。 为 了 实现 这 个 目的 ， 
我 们 首先 要 利用 图 1-20 中 “复制 和 取 反 ”的 步骤 ， 然 后 对 获得 的 模式 进行 解码 ， 就 仿佛 它 只 是 
一 个 简单 的 二 进 制 表示 。 例如 , 为 了 对 模式 1010 解 码 , 我 们 首先 要 意识 到 , 因为 这 个 符号 位 是 1， 
表示 的 数值 就 是 负 的 。 因 此 ， 我 们 利用 “复制 和 取 反 ”步骤 获得 模式 0110， 认 识 到 这 是 6 的 二 进 
制 表示 ， 然 后 得 出 结论 : 原始 的 模式 表示 -6。 

1. 二 进 制 补 码 记 数 法 中 的 加 法 

为 了 计算 二 进 制 补 码 记 数 法 中 的 数值 相 加 ， 我 们 采用 了 二 进 制 加 法 中 使 用 的 算法 ， 只 是 包 
括 答案 在 内 的 所 有 位 模式 长 度 都 相同 。 这 就 意味 十进制 问题 二 进 制 补 码 问题 。 十 进 制 答案 
着 , 在 做 二 进 制 补 码 系 统 的 加 法 时 ， 如 果 最 后 一 个 ， i ER 
进位 导致 答案 左边 产生 了 附加 位 , 那么 这 个 附加 位 
一 定 会 被 截断 。 因 此 ,“ 加 法 运算 ”0101 和 0010 得 
出 0111，0111 和 1011 得 出 0010 (0111+1011=10010， 
被 截断 为 0010 )。 

根据 这 个 理解 ， 我 们 来 分 析 一 下 图 1-21 中 的 3 
个 加 法 问题 。 每 一 个 情况 , 我们 都 把 问题 转化 为 二 
进 制 补 码 记 数 法 (采用 长 度 为 4 的 位 模式 ), 演示 先 : 
前 描述 过 的 加 法 过 程 ， 然 后 对 结果 进行 解码 ， 回 到 ”图 1-21 转换 为 二 进 制 补 码 记 数 法 的 加 法 问题 
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一 般 的 十 进 制 记 数 法 。 

注意 ， 图 1-21 中 的 第 3 个 问题 涉及 正 数 和 负数 的 加 法 ， 它 展示 了 二 进 制 补 码 记 数 法 的 一 个 主 
要 优点 : 有 符号 数 的 任何 组 合 加 法 ， 都 可 以 使 用 相同 的 算法 从 而 使 用 相同 的 电路 来 实现 。 这 与 
人 们 传统 的 算术 运算 截然 不 同 。 尽 管 小 学 生 是 先 学 加 法 ， 后 学 减法 ， 但 是 应 用 二 进 制 补 码 记 数 
法 的 机 器 只 需要 知道 如 何 相 加 就 可 以 了 。 

例如 ， 减 法 问题 7-5 与 加 法 问题 7+ (-5) 是 一 样 的 。 因 此 ， 如 果 人 们 命令 计算 机 执行 7〈 存 
储 为 0111) 减 5 (存储 为 0101)， 那 么 它 首先 要 将 5 转换 为 =<5〈 表 示 为 1011)， 然 后 执行 0111+1011 
的 加 法 过 程 ， 得 到 代表 数值 2 的 0010， 如 下 所 示 : 


7 0111 0111 
sa 3 E00 有 主 1011 


0010 ”一 | 


由 此 我 们 可 以 看 到 ， 当 用 二 进 制 补 码 记 数 法 表示 数字 值 时 ， 只 需要 将 一 个 加 法 电路 与 一 个 取 负 
电路 组 合 在 一 起 ， 就 足以 同时 解决 加 法 和 减法 这 两 个 问题 了 。( 这 些 电路 的 图 示 及 解释 详 见 附录 B。) 

2. 溢出 问题 

我 们 在 前 面 的 例子 中 避 开 了 这 样 一 个 问题 : 任意 一 个 二 进 制 补 码 系统 对 所 能 表示 的 数值 大 
小 都 有 限制 。 当 使 用 4 位 模式 二 进 制 补 码 时 ， 可 以 表示 的 最 大 正 整数 是 7， 最 小 负 整 数 是 -8。 具 
体 来 说 ， 就 是 无 法 表示 数值 9;， 这 就 意味 着 我 们 不 能 指望 得 出 5+4 的 正确 答案 。 事 实 上 ， 它 的 结 
果 会 为 -7。 这 种 现象 称 为 溢出 (overflow)。 也 就 是 说 ， 溢 出 指 的 是 这 样 一 个 问题 ， 即 计算 得 出 
的 数值 超出 了 可 以 表示 的 数值 范围 。 使 用 二 进 制 补 码 记 数 法 时 ， 两 个 正 值 相 加 或 两 个 负 值 相 加 
都 可 能 会 出 现 这 种 情况 。 无 论 哪 种 情况 ， 检 查 答 案 的 符号 位 就 可 以 发 现 溢 出 的 条 件 。 如 果 两 个 
正 值 相 加 的 结果 是 负 值 的 模式 ， 或 者 两 个 负 值 相 加 的 结果 为 正 ， 那 么 就 发 生 了 溢出 问题 。 

当然 ， 使 用 二 进 制 补 码 系统 的 大 多 数 计算 机 的 位 模式 ， 都 比 我 们 上 面 例子 中 给 出 的 长 ， 因 
而 在 进行 较 大 数值 操作 时 不 会 产生 溢出 。 现 在 ， 人 们 普遍 使 用 二 进 制 补 码 记 数 法 的 32 位 模式 来 
存储 数值 ， 可 以 得 到 的 最 大 正 值 是 2 147 483 647。 如 果 需 要 更 大 的 数值 ， 我 们 可 以 使 用 更 长 的 
位 模式 ， 或 者 改变 度量 单位 。 例 如 ， 在 解答 一 个 问题 时 用 英尺 代替 英寸 ,所 得 的 数值 就 会 变 小 ， 
而 且 也 可 以 达到 所 要 求 的 精确 度 。 

关键 问题 是 计算 机 会 制造 错误 。 因 此 ， 使 用 机 器 的 人 一 定 要 意识 到 可 能 涉及 的 危险 。 其 中 一 个 
问题 就 是 , 计算 机 程序 员 和 使 用 者 会 自满 而 导致 忽视 一 个 事实 一 一 小 数值 可 以 累加 成 大 数值 ,例如 ， 
人 们 过 去 普遍 使 用 二 进 制 补 码 记 数 法 的 16 位 模式 表示 数值 ， 这 就 意味 着 出 现 大 于 或 等 于 25=32 768 的 
数值 时 就 会 产生 溢出 。1989 年 9 月 19 日 ， 一 家 医院 多 年 来 运行 良好 的 计算 机 出 现 了 故障 。 仔 细 检 查 后 
发 现 ， 那 天 距 1900 年 1 月 1 日 共 32 768 天 ， 而 计算 机 的 程序 正 是 基于 那个 起 始 日 期 开始 计算 日 期 的 。 因 
此 ， 由 于 溢出 原因 ，1989 年 9 月 19 日 的 日 期 产生 了 负 值 一 一 设计 计算 机 程序 时 没有 考虑 到 这 种 现象 。 


1.6.2 ” 余 码 记 数 法 


表示 整数 值 的 另外 一 种 方法 是 余 码 记 数 法 (excess notation)。 与 二 进 制 补 码 记 数 法 相同 ， 
余 码 记 数 法 中 的 每 一 个 数值 也 都 是 用 相同 长 度 的 位 模式 表示 的 。 为 了 建立 余 码 系统 ， 我 们 首先 
要 选择 所 使 用 的 模式 长 度 ， 然 后 根据 二 进 制 记 数 呈现 的 顺序 写 下 那个 长 度 的 所 有 位 模式 。 接 着 
我 们 发 现 ， 二 进 制 1 作为 其 最 高 位 的 第 一 个 模式 大 约 就 在 数列 的 中 间 。 我 们 用 这 个 模式 表示 0， 
其 前 的 模式 就 分 别 用 于 表示 -1, -2, -3，…， 其 后 的 模式 分 别 用 于 表示 1, 2, 3，…。 使 用 长 度 为 4 
的 模式 产生 的 编码 如 图 1-22 所 示 。 我 们 可 以 看 到 ， 模 式 1101 表 示 数 值 5，0011 表 示 数 值 -5。( 注 
意 ， 余 码 系统 和 二 进 制 补 码 系统 的 区 别 就 是 符号 位 相反 。) 

图 1-22 表 示 的 系统 称 为 余 8 记 数 法 。 为 了 了 解 其 由 来 , 我 们 先 用 传统 二 进 制 系统 的 编码 解释 每 
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一 个 模式 ， 然 后 将 其 与 余 码 记 数 法 表示 的 数值 进行 比较 。 你 会 发 现 ， 每 一 个 模式 的 二 进 制 解 释 
值 都 要 比 余 码 记 数 法 解释 值 大 8。 例 如 ， 模 式 1100 在 二 进 制 记 数 法 中 表示 数值 12， 在 余 码 系统 中 
表示 4; 0000 在 二 进 制 记 数 法 中 表示 数值 0， 但 是 在 余 码 系统 中 表示 -8。 与 此 类 似 ， 在 基于 长 度 
为 5 的 位 模式 的 余 码 系统 中 ， 模 式 10000 表 示 的 是 0， 而 不 是 通常 的 数值 16， 该 记 数 法 称 为 余 16 
记 数 法 。 同 样 ， 你 可 以 证 明 3 位 余 码 系统 应 该 称 为 余 4 记 数 法 〈 见 图 1-23 )。 


过 


iD 


(LOD 


大 







位 模式 ”所 表示 的 值 
' Nn 
vn 
| . ,i 
pbs 
un 3 
A020 六 
1001 w 
E090 1 9 位 模式 所 表示 的 值 
0111 > 
0110 5 人 3 
0101 £3 110 2 
0100 -和 4 101 1 
O0011 -5 100 0 
0010 Ne 011 9 
0001 2 010 < 过 
0000 -8 001 -3 
000 -4 
图 1-22 余 8 代 码 转 换 表 图 1-23 ”使 用 长 度 为 3 的 位 模式 的 余 码 记 数 系 统 
问题 与 练习 
将 下 面 每 一 个 二 进 制 补 码 表示 转换 为 相应 的 十 进 制 形式 。 
a. 00011 b. 01111 c.11100 
d 11010 e. 00000 f.10000 
. 用 8 位 位 模式 将 下 列 每 一 个 十 进 制 表示 转换 为 相应 的 三 进 制 补 码 形式 。 
a.6 m6 oe 
du ls Cd f.0 
. 假定 下 列 位 模式 表示 的 是 用 二 进 制 补 码 记 数 法 存储 的 数值 ， 求 出 每 一 个 值 的 负 值 的 三 进 制 补 码 表示 。 
a.00000001 b. 01010101 GTLHLILEOU 
寺 0 e. 00000000 f OP LLTL 
假定 一 台 机 器 用 二 进 制 补 码 记 数 法 存储 数值 , 如 果 机 器 分 别 采 用 下 列 长 度 的 位 模式 , 那么 可 以 存储 的 
最 大 数 和 最 小 数 分 别 是 什么 ? 
a.4 b.6 - c.8 


: 


全 


< 了 


在 下 列 问题 中 , 每 个 位 模式 表示 一 个 用 二 进 制 补 码 存储 的 数值 。 请 执行 文中 所 述 的 加 法 过 程 , 按照 二 
进 制 补 码 记 数 法 求 出 它们 的 答案 。 并 将 问题 及 答案 转换 为 十 进 制 记 数 法 进行 验证 。 

a.0101+0010 b.0011+0001 c. 0101+1010 

d.1110+0011 @.1010+1110 

计算 下 列 由 三 进 制 补 码 记 数 法 表示 的 问题 , 但 这 次 要 观察 溢出 问题 , 并 指出 哪个 答案 因 产 生 溢出 而 不 正确 。 
a.0100+0011  b.0101+0110 €. 1010+1010 

d. 1010#0111  &.0111+0001 


: 将 下 列 问题 从 十 进 制 记 数 法 转换 为 长 度 为 4 的 位 模式 的 二 进 制 补 码 记 数 法 ， 然 后 将 每 一 个 问题 转换 成 


一 个 相应 的 加 法 问题 (如 机 器 的 做 法 ), 然后 执行 加 法 。 将 求 得 的 答案 转换 为 十 进 制 记 数 法 进行 验证 。 
a. 6-(-1) bb 3=(=2) © ,M6 
.2=(=4) e. 1-5 
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8. 在 二 进 制 补 码 记 数 法 里 ， 一 个 正 数 和 一 个 负数 相 加 时 会 产生 溢出 吗 ? 请 说 明理 由 。 
9. 将 下 面 每 一 个 余 8 码 表示 转换 为 相应 的 十 进 制 形式 〈 解 题 时 不 要 看 文中 的 表格 )。 


a, 1110 只 -如 二 于 和 c.1000 
d. 0010 e. 0000 全 1001 
10. 将 下 列 的 每 一 个 十 进 制 表 示 转 换 为 相应 的 余 8 码 形式 〈 解 题 时 不 要 看 文中 的 表格 )。 
| b=3 C3 
d.0 人 了 £8 


11. 数值 9 可 以 用 余 8 记 数 法 表示 吗 ? 用 余 4 记 数 法 表示 6 呢 ? 请 说 明理 由 。 


Cr mg at mee rr 


*1.7 ”小数 的 存储 


不 同 于 整数 存储 ， 对 于 包括 小 数 部 分 的 数值 的 存储 , 我 们 不 仅 要 存储 代表 其 二 进 制 表示 的 0 
和 1， 还 要 存储 其 小 数 点 的 位 置 。 有 一 种 流行 的 基于 科学 记 数 法 的 存储 方法 ， 称 为 浮 点 
Cfloating-point) 记 数 法 。 


1.7.1 浮 点 记 数 法 


为 了 解释 浮 点 记 数 法 ， 我 们 来 看 一 个 只 用 一 个 字 节 来 存储 的 例子 。 尽 管 机 器 通常 使 用 更 长 
的 模式 , 但 是 这 种 8 位 格式 也 可 以 表示 实际 的 系统 ,而且 既 可 以 展示 重要 的 概念 ， 又 避免 了 长 位 
模式 的 混乱 。 

首先 ， 我 们 规定 这 个 字 节 的 高 位 端 为 符号 位 。 再 次 说 明 ， 符 号 位 中 的 二 进 制 0 代表 存储 的 数 
值 为 非 负 值 ，1 代 表 数值 为 负 值 。 接 着 ， 我 们 将 这 个 字 节 剩 余 的 7 个 位 分 为 2 组 ， 或 称 其 为 域 : 指 
数 域 (exponent field) 和 尾数 域 (mantissa field)。 我 们 规定 符号 位 右边 的 3 个 位 为 指数 域 ， 余 下 
的 4 个 位 为 尾数 域 。 图 1-24 描 述 了 如 何 拆 分 字 节 

我 们 可 以 借助 下 面 的 例子 解释 这 些 域 的 含义 。 假 如 一 四 由 轩 大 |- 位 的 位 和 
个 字 节 由 位 模式 01101011 组 成 。 利用 前 面 的 形式 分 析 这 个 Te 
模式 ,可 以 看 出 符号 位 是 9， 指 数 是 110， 尾 数 是 1011。 为 尾数 





了 对 这 个 字 节 人 解码， 我们 首先 要 求解 它 的 尾数 ， 并 在 它 的 指数 
左边 放置 一 个 小 数 点 ， 得 到 符号 位 
,LL 图 1-24 浮 点 记 数 法 成 分 


接着 ， 我 们 求解 指数 域 110) 的 内 容 ， 并 将 其 解释 为 一 个 用 3 位 余 码 方法 〈 见 图 1-23) 存 
储 的 整数 。 从 而 得 出 ,我 们 所 举例 子 的 指数 域 模式 表示 正 数 2。 这 就 要 求 我 们 将 上 面 所 得 结果 的 
小 数 点 向 右 移 动 2 位 。( 负 指数 域 就 意味 着 向 左 移动 小 数 点 。) 因此 ， 我 们 可 以 得 到 


0 
这 就 是 2 的 二 进 制 表示 (二进制 中 的 小 数 的 表示 参见 图 1-18)。 接 着 ， 我 们 看 到 例子 中 的 符号 


位 是 0, 因此 所 表示 的 值 为 非 负 值 。 最 后 得 出 结论 : 字 节 01101011 表 示 22 。 如 果 模式 是 11101011 


(除了 符号 位 都 与 之 前 相同 )， 表 示 的 数值 就 将 为 -2 4 


再 看 一 个 例子 ， 字 节 00111100。 求 尾数 后 得 到 


了 上 上 06 
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因为 指数 域 (011) 表示 数值 -1， 所 以 将 小 数 点 向 左 移动 一 位 ， 得 到 


“QL100 

这 表示 。 因 为 原始 模式 中 的 符号 位 是 9， 所 以 存储 的 数值 为 非 负 值 。 最 后 得 出 结论 : 模式 00111100 
8 
表示 。 

在 用 浮 点 记 数 法 存储 数值 时 ， 要 颠倒 前 面 的 过 程 。 例 如 ， 为 了 对 15 编码 ， 我 们 首先 要 将 其 
用 二 进 制 记 数 法 表示 ， 得 到 1.001。 接 着 ， 我 们 要 从 左 到 右 从 二 进 制 表示 的 最 左边 的 1 开始 ， 将 
其 位 模式 复制 到 尾数 域 。 此 时 ， 这 个 字 节 如 下 : 

我 们 现在 必须 填充 指数 域 。 为 了 达到 这 个 目的 ， 假 定 尾 数 域 的 左边 有 一 个 小 数 点 ， 然 后 规 
定位 的 数量 以 及 小 数 点 移动 的 方向 ， 以 此 得 到 原始 的 二 进 制 数字 。 在 这 个 例子 中 我 们 可 以 看 
到 ，.1001 中 的 小 数 点 要 向 右 移动 一 位 才能 得 到 1.001， 指 数 因此 为 正 1， 所 以 我 们 将 101 (在 余 4 
记 数 法 中 表示 正 1， 见 图 1-23) 置 于 指数 域 。 最后， 因为 存储 的 数值 是 非 负 的 ， 我 们 用 0 填充 符 
号 位 。 完 成 的 字 节 如 下 : 

久违 工 二 尖 二 灿 

当 填 充 尾 数 域 时 ， 你 可 能 会 漏 掉 一 个 微妙 的 细节 。 这 个 规则 是 从 最 左边 的 1 开始 ， 从 左 到 右 
复制 以 二 进 制 表示 的 位 模式 。 为 亲 述 清楚 ， 让 我 们 考虑 一 下 存储 数值 的 过 程 ， 它 的 二 进 制 记 
数 法 表示 为 .011。 这 时 ， 其 尾数 为 





这 是 因为 我 们 是 从 二 进 制 表 示 最 左边 的 1 开始 填充 尾数 域 。 遵 循 这 个 规则 的 表示 称 为 规范 化 形式 
(normalized form ) 。 


使 用 规范 化 形式 减少 了 同一 数值 多 种 表示 的 可 能 性 。 例 如 ，00111100 和 01000110 都 可 以 解 
码 成 二 ， 但 是 只 有 第 一 个 模式 才 是 规范 化 形式 。 遵循 规 范 化 形式 也 意味 着 ， 所 有 非 0 数 值 的 表示 
都 会 有 一 个 以 1 开始 的 尾数 。 不 过 ， 数 值 0 是 一 个 特例 ， 它 的 浮 点 表示 就 是 全 部 为 0 的 位 模式 。 
1.7.2 截断 误差 

下 面 我 们 来 考虑 一 下 ， 用 我 们 的 1 字 节 浮 点 记 数 系统 存储 数值 23 ， 看 看 会 出 现 什么 恼人 的 
问题 。 我 们 首先 用 二 进 制 写 23， 得 到 10.101。 但 是 ， 当 把 这 个 模式 复制 到 尾数 域 时， 我 们 就 用 
尽 了 空间 ， 最 右边 的 1 (表示 最 后 的 < ) 因此 丢失 了 ( 见 图 1-25)。 如 果 现 在 忽视 这 个 问题 ， 继 


续 填 充 指数 域 和 符号 位 ， 那 么 我 们 最 后 得 到 的 位 模式 将 为 01101010， 它 表示 的 是 2 了 ， 而 不 是 
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2 这 个 现象 称 为 截断 误差 (truncation error) 或 舍 入 本 上 妈 表 示 
误差 (round-off error)。 这 就 意味 着 ， 由 于 尾数 域 空间 出 
不 够 大 ， 存 储 的 部 分 数值 丢失 了 。 0 
使 用 较 长 的 尾数 域 可 以 减少 这 种 误差 的 发 生 。 事 实 | 
上 ， 现 在 生产 的 大 多 数 计算 机 都 至 少 采用 32 位 存储 浮 点 ax 
记 数 法 表示 的 数值 ， 而 不 是 我 们 在 本 书 中 采用 的 8 位 。 wey 
这 同时 使 得 指数 域 也 更 长 。 不 过 ， 即 使 有 这 样 较 长 的 格 一 一 
式 ， 有 时 候 还 是 需要 更 高 的 精确 度 。 :| 
截断 误差 的 另外 一 个 来 源 是 十 进 制 记 数 法 中 比较 Ee 天 类 的 位 
常见 的 一 个 现象 ， 即 无 穷 展开 式 问题 ， 例 如 ， 我 们 在 用 尾数 
十 进 制 形式 表示 3 的 时 候 。 有 些 数值 无 论 我 们 用 多 少 位 Ay 


数字 都 无 法 精确 地 表示 。 传 统 的 十 进 制 记 数 法 与 二 进 制 Ee 
记 数 法 的 区 别 在 于 ， 二 进 制 记 数 法 中 有 无 穷 展开 式 的 数 a i 
值 多 于 十 进 制 。 例 如 ， 数 值 表示 为 二 进 制 时 为 无 穷 展开 式 。 想 象 一 下 ， 一 个 粗心 的 人 用 浮 点 


记 数 法 存储 和 处 理 美元 与 美 分 时 会 产生 什么 样 的 问题 ? 尤其 是 ， 如 果 美 元 被 用 作 度量 单位 ， 那 
么 一 角 就 不 能 被 精确 地 存储 。 其 中 一 个 解决 方式 就 是 ， 以 分 为 单位 处 理 数 据 ， 这 样 所 有 的 数值 
就 都 是 整数 ， 都 可 以 用 诸如 二 进 制 补 码 这 样 的 方法 精确 存储 。 





errmrrrwgemrn mpeg 毕竟 ry 这 
一 记 数 法 的 8 位 只 能 表示 其 中 256 个 数 。 我 们 在 讨论 中 使 用 了 8 位 模式 来 保持 示例 的 简 单 性 , 但 
依然 涵盖 了 重要 的 基本 概念 。 . 

现在 的 许多 计算 机 者 支持 32 位 形式 的 单 精度 浮 点 (single precision floating point ) 记 数 法 





一 格式 使 用 1 位 表示 符号 位 ， 用 8 位 表示 指数 〔 余 码 记 数 法 中 的 )， 用 23 位 表示 尾数 
度 浮 ， 0 ls de nl 人 《 雪 生 色光 ua, i 和 


he ( double precision float 
进 制 有 效 数字 。 


截断 误差 和 与 之 相关 的 问题 是 工作 在 数值 分 析 领 域 的 人 们 每 天 都 很 关注 的 问题 。 这 个 数学 
分 支 研究 的 是 执行 大 规模 、 高 精度 有 效 计 算 所 涉及 的 问题 。 

下 面 的 例子 可 以 激 起 任何 一 位 数值 分 析 家 的 兴趣 。 假 设 我 们 要 应 用 前 面 定义 的 1 字 节 浮 点 记 
数 法 来 做 这 3 个 数值 的 加 法 : 





tin i 记 数 法 ，j 多 


nd 


如 果 我 们 按照 上 述 顺 序 加 数值 ， 首先 就 是 2 二 加 上 二 ， 得 到 2 ， 二 进 制 表 示 为 10.101。 遗 憾 的 


是 , 因为 这 个 数值 不 能 被 精确 地 存储 (如 同 前 面 所 看 到 的 ), 我 们 第 一 步 的 结果 最 后 被 存储 为 2 
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(与 其 中 一 个 加 数 相同 )。 下 一 步 是 把 这 个 结果 再 加 到 最 后 的 < 上。 截断 误差 在 这 里 再 一 次 出 现 ， 
最 后 的 结果 是 错误 的 2 。 

现在 让 我 们 以 相反 的 顺序 来 加 这 些 数值 ; 首先 将 加 到 三 上 , 得 到 了 ,其 二 进 制 表示 为 01。 
re Pe er 


数列 中 的 下 一 个 数值 2 多 得 到 2 了 ， 我 们 可 以 在 一 个 字 节 里 精确 地 将 其 存储 为 01101011。 这 


次 的 答案 是 正确 的 。 

总 而 言 之 ， 在 浮 点 记 数 法 表示 的 数字 值 加 法 中 ， 它 们 相 加 的 顺序 很 重要 。 问 题 是 ， 如 果 一 
个 很 大 的 数字 加 上 一 个 很 小 的 数字 ， 那 么 小 数字 就 可 能 被 截断 。 因 此 ， 多 个 数值 相 加 的 一 般 规 
则 是 先 加 小 数字 ， 即 希望 在 将 它们 加 到 一 个 较 大 的 数值 上 时 ， 能 累计 成 一 个 显著 的 值 。 这 就 是 
前 面 例子 中 反映 的 现象 。 

现在 商用 软件 包 的 设计 师 们 在 这 方面 做 得 很 好 ， 他 们 使 没有 经 过 培训 的 使 用 者 也 能 很 好 地 
避免 这 种 问题 的 发 生 。 在 一 个 典型 的 电子 表格 系统 中 ， 除 非 相 加 的 各 个 数值 大 小 差别 达到 10" 
或 更 多 ， 否 则 所 得 结果 都 是 正确 的 。 因 此 ， 如 果 你 认为 有 必要 对 数值 

10 000 000 000 000 000 
加 1， 那 么 会 得 到 答案 

10 000 000 000 000 000 
而 不 是 

10 000 000 000 000 001 


这 样 的 问题 在 一 些 应 用 (如 导航 系统 ) 中 是 很 严重 的 ， 微 小 的 误差 会 在 加 法 运算 中 累加 ， 最 终 
产生 严重 的 后 果 。 但 是 ， 对 于 一 般 的 PC 使 用 者 ， 大 多 数 商 用 软件 提供 的 精确 度 已 经 足够 了 。 


问题 与 练习 
1. 用 文中 所 述 的 浮 点 格式 对 下 列 位 模式 进行 解码 。 
a. 01001010 9 e. I0101011 
2. 将 下 列 数值 编码 成 文中 所 述 的 浮 点 格式 。 指 出 截断 误差 的 出 现 情况 。 
a b 5 c d -3 -4 
3. 根据 文中 所 述 的 浮 点 格式 , 模式 01001001 和 00111101 中 哪 一 个 表示 的 值 更 大 ? 描述 一 种 确定 哪个 模式 


表示 的 值 更 大 的 简单 过 程 。 
. 使 用 文中 所 述 的 浮 点 格式 时 ， 可 以 表示 的 最 大 值 是 什么 ? 可 以 表示 的 最 小 正 值 是 什么 ? 


小 


ga A Be rr mea 
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虽然 人 类 发 明了 构成 现代 计算 机 的 数据 表示 和 基本 操作 ， 但 很 少 有 人 特别 擅长 于 直接 在 计 
算 机 的 这 个 层面 上 工作 。 人 们 喜欢 在 更 高 的 抽象 层次 上 推理 计算 问题 ， 他 们 依赖 计算 机 来 处 理 
最 底层 的 细节 问题 。 程 序 设计 语言 (programming language) 是 人 类 创造 的 一 个 计算 机 系统 ， 通 


ee re 
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过 它 ， 人 们 能 够 使 用 更 高 层次 的 抽象 向 计算 机 精确 地 表达 算法 。 

在 20 世 纪 , 对 计算 机 进行 程序 设计 被 认为 是 少数 训练 有 素 的 专家 们 才能 涉足 的 领域 , 当然 ， 
仍然 有 许多 计算 问题 需要 有 经 验 的 计算 机 科学 家 和 软件 工程 师 的 关注 。 不 过 ， 到 了 21 世 纪 ， 随 
着 计算 机 和 计算 与 我 们 现代 生活 中 的 方方面面 交织 在 一 起 的 程度 的 日 益 加 深 ， 更 加 难以 确定 哪 
些 职业 不 需要 至 少 有 某 种 程度 的 编程 技能 。 事 实 上 ， 一 些 人 已 经 把 程序 设计 或 编码 确定 为 现代 
读 写 能 力 中 继 阅 读 、 写 作 及 算术 之 后 的 又 一 个 基础 支柱 了 。 

在 本 节 以 及 后 续 章 节 的 程序 设计 补充 部 分 ， 我 们 会 看 到 程序 设计 语言 是 如 何 反 映 本 章 主要 
内 容 ， 以 及 如 何 让 人 类 更 容易 地 解决 计算 问题 的 。 


1.8.1 Python 入门 


Python 是 一 门 程序 设计 语言 ， 由 吉 多 。 范 罗 苏 姆 〈Guido van Rossum) 于 20 世 纪 80 年 代 后 期 
创立 。 现 在 它 是 十 大 最 常用 的 语言 之 一 ， 仍 然 深 受 网 络 应 用 开发 领域 及 科学 计算 领域 人 士 的 喜 
爱 ， 并 被 视 为 学 生 的 入 门 语言 。 使 用 Python 的 组 织 ， 从 谷歌 到 美国 国家 航空 航天 局 (NASA)， 
从 DropBox 公 司 到 工业 光 魔 公司 〈Industrial Light & Magic)， 范 围 很 广 ; 使 用 Python 的 计算 机 用 
户 也 横 跨 非 正式 、 科 学 和 艺术 领域 。Python 强 调 可 读 性 ， 包 括 命令 型 程序 设计 范 型 、 面 向 对 象 
型 程序 设计 范 型 和 函数 式 程序 设计 范 型 等 三 大 要 素 ， 这 些 将 在 第 6 章 中 介绍 。 

用 于 编辑 和 运行 用 Python 编写 的 程序 的 软件 可 以 免费 从 www.Python ,org 获得， 这 里 还 有 很 多 
其 他 的 入 门 资源 。Python 语 言 一 直 在 不 断 演变 ， 本 书 的 所 有 示例 都 将 使 用 Python 3 这 个 版 本 。 更 早 的 
Python 版 本 能 够 运行 非常 类 似 的 程序 ， 但 是 自 Python 2 版 本 开始 有 了 许多 细微 的 变化 ， 如 标点 符号 。 

Python 是 一 种 解释 型 语言 (interpreted language)， 这 意味 着 初学 者 可 以 将 Python 指令 键入 交 
互 提示 符 中 ， 或 者 将 Python 指令 存储 在 一 个 〈 称 为 “脚本 ”的 ) 纯 文 本 文件 里 以 后 运行 。 在 下 
面 的 示例 中 ， 这 两 种 模式 都 可 以 使 用 ， 但 练习 和 复习 题 一 般 都 要 求 用 Python 脚本 来 完成 。 


1.8.2 ”你 好 ，Python 


许多 程序 设计 语言 的 介绍 长 久 以 来 一 直 有 一 个 传统 ， 描 述 的 第 一 个 程序 都 是 “Hello, 
World”。 这 个 简单 的 程序 输出 一 个 名 义 上 的 问候 ， 演 示 一 种 特定 语言 是 如 何 产生 结果 以 及 如 何 
表示 文本 的 。 在 Python 中 ， 这 个 程序 的 写法 如 下 : 

print('Hello, World!"') 

可 以 将 这 条 语句 键入 Python 的 交互 解释 器 里 ， 也 可 以 把 它 存 为 Python 脚本 后 再 执行 。 不 管 
用 哪 一 种 方式 ， 最 后 的 结果 都 应 该 是 : 


Hello, World! 


Python 会 把 两 个 引号 之 间 的 文本 返回 给 用 户 。 

即使 是 在 这 种 简单 的 Python 脚 本 里 面 ， 也 有 几 个 需要 注意 的 方面 。 首 先 ，print 是 一 个 内 置 函 
数 ， 是 Python 脚本 用 来 产生 输出 的 一 个 预定 义 操 作 ， 输 出 指 的 是 一 个 能 够 让 用 户 看 到 的 程序 结果 。 
这 个 打印 函数 后 面 有 一 个 开 括号 和 一 个 闭 括号 ， 这 两 个 括号 之 间 的 内 容 就 是 要 打印 的 值 。 

其 次 ，Python 可 以 使 用 单 引 号 来 表示 文本 串 。 大 写字 母 B 前 面 的 引号 和 感叹 号 后 面 的 引号 ， 
分 别 表示 由 字符 组 成 的 字符 串 的 开头 和 结尾 ， 在 Python 中 ， 这 个 字符 串 会 被 当 作 值 。 

程序 设计 语言 能 够 非常 精确 地 完成 它们 的 指令 。 即 使 用 户 只 是 稍微 修改 一 下 打印 语句 中 开 





QD 下面 这 个 Python 代码 是 用 该 语言 的 3 版 本 写 出 来 的 , 本 书后 面 会 直接 把 这 个 版 本 的 Python 称 作 “ Python ”.。 较 早 的 Python 
版 本 并 不 总 是 要 求 开 括号 和 闭 括号 。 
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始 引 号 和 结束 引号 之 间 的 消息 ， 最 后 打印 出 来 的 文本 也 会 相应 地 变化 。 花 一 点 儿 时 间 ， 在 打印 
语句 中 试 试 不 同 的 大 小 写 、 不 同 的 标点 符号 ， 甚 至 不 同 的 单词 ， 读 者 会 看 到 确实 是 这 样 。 


1.8.3 变量 


Python 人 允许 用 户 给 值 命名 以 备 日 后 使 用 ， 这 是 构造 简洁 、 易 懂 的 脚本 时 的 一 个 重要 抽象 。 
这 些 命名 的 存储 位 置 被 称 为 变量 〈variable)， 类 似 于 代数 课程 中 的 数学 变量 。 下 面 来 看 一 下 略 
有 增强 的 Hello World 版 本 : 


message = "Hello, World!'" 
print (message) 


在 这 个 脚本 中 ， 第 一 行 是 一 个 赋值 语句 (assignment statement)。= 号 的 使 用 可 能 会 让 习惯 
了 等 号 的 代数 用 法 的 初学 者 感到 迷惑 。 这 个 赋值 语句 应 该 读 作 :“ 变 量 message 被 赋予 字符 串 值 
'Hello，World!'。” 通 常 ， 赋 值 语句 由 等 号 左边 的 变量 名 和 等 号 右边 的 值 构成 。 

Python 是 一 种 动态 类 型 (dynamically typed) 语言 ， 这 意味 着 ， 我 们 不 需要 在 建立 脚本 时 提 
前 创建 好 一 个 名 为 message 的 变量 ， 或 是 什么 类 型 的 值 应 该 存储 在 message 中 ， 而 只 需要 在 这 
个 脚本 中 说 明 我 们 的 文本 串 会 被 赋 给 message， 接 着 在 后 面 的 Print 语句 中 引用 这 个 变量 
message 就 行 了 。 

变量 的 命名 很 大 程度 上 取决 于 Python 用 户 。Python 的 简单 规则 是 : 变量 名 必须 以 字母 开头 ， 
可 以 包含 任意 数量 的 字母 、 数 字 和 下 划 线 字符 〈_)。 虽 然 对 于 一 个 两 行 的 示例 脚本 来 说 ， 可 能 
把 变量 命名 为 m 就 可 以 了 ， 但 有 经 验 的 程序 员 都 会 在 他 们 的 脚本 中 尽量 给 变量 起 一 个 有 意义 的 、 
具有 描述 性 的 名 字 。 

Python 变量 名 是 区 分 大 小 写 的 〈case-sensitive)， 即 有 大 小 写 问 题 。 名 为 size 的 变量 ， 与 名 
为 Size 或 SIZE 的 变量 是 截然 不 同 的 。 有 一 小 部 分 关键 字 (keyword)， 即 为 Python 中 的 一 些 特殊 
含义 保留 的 名 字 ， 不 能 用 作 变 量 名 。 在 Python 的 内 置 帮助 系统 里 能 查看 到 这 个 关键 字 清 单 。 


help('keywords') 


变量 可 用 于 存储 Python 能 表示 的 所 有 类 型 的 值 。 
my _ integer = 5 

my floating Point = 26.2 

my_Boolean = True 


my_string = 'characters' 


观察 上 面 这 些 值 的 类 型 ， 它 们 与 本 章 前 面 介 绍 的 表示 方法 是 相对 应 的 ， 布尔 值 真 和 假 〈 见 
1.1 节 入 文本 《〈 见 1.4 节 )、 整 数 〈 见 1.6 节 ) 和 浮 点 数 〈 见 1.7 节 )。 通 过 Python 的 其 他 代码 〈 超 出 
了 本 书简 单 介 绍 的 范围 )， 我 们 还 能 够 用 Python 变量 存储 图 像 和 声音 数据 《〈 见 1.4 节 )。 

Python 使 用 0x 前 组 来 表示 十 六 进 制 值 ， 如 

my_integer = 0XFE 

print (my integer) 

不 管 程序 员 在 推理 过 程 中 使 用 什么 样 的 记 数 系统 ， 指 定 一 个 十 六 进 制 的 值 都 不 会 改变 计算 
机 存储 器 中 该 值 的 表示 ， 存 储 器 都 会 把 整数 值 存储 为 许多 个 1 和 0。 十 六 进 制 记 数 法 仍然 是 人 类 
在 用 的 一 种 有 助 于 理解 脚本 的 快捷 表示 。 因 此 ， 上 面 的 print 语 句 打印 出 来 的 是 255, 即 十 六 进 
制 0xFF 的 十 进 制 解释 ， 因 为 这 是 print 的 默认 行为 。 用 更 复杂 的 print 语 名 可 以 输出 其 他 表示 
形式 的 值 ， 但 本 书 只 讨论 我 们 比较 熟悉 的 十 进 制 表示 。 

Unicode 字 符 包 含 着 无 所 不 在 的 ASCII 子 集中 所 没有 的 字符 , 在 文本 编辑 器 支持 Unicode 字 符 
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时 ， 可 以 直接 在 字符 串 里 包含 Unicode 字 符 : 


Brint ("T1000"] # Prints 31000, one thousand Indian Rupees 
或 者 用 前 级 '\u' 和 4 个 十 六 进 制 数字 来 指定 Unicode 字 符 : 
print('\u00A31000') # Prints £1000, one thousand British 


# Pounds Sterling 
字符 串 的 '\u00A31' 部 分 会 对 英镑 符号 的 Unicode 表 示 进 行 编码 。 后面 紧 跟着 写 '1000'， 这 
样 最 终 输 出 的 货币 符号 和 数量 之 间 就 不 会 有 空格 了 : £1000。 
除了 Unicode 文 本 串 ， 这 些 示例 语句 引入 了 另外 一 种 语言 特性 。# 号 表示 注释 (comment) 
的 开始 ， 这 是 一 个 人 类 可 读 的 Python 代码 符号 ， 在 计算 机 执行 时 会 被 忽略 。 有 经 验 的 程序 员 会 
在 他 们 的 代码 中 使 用 注释 来 解释 算法 难 懂 的 部 分 ， 包 括 历 史 或 来 源 信息 ， 或 者 只 写 些 读 代码 的 
人 应 该 注意 的 问题 。# 号 右边 一 直到 行 尾 的 所 有 字符 都 会 被 Python 忽略 。 


1.8.4 运算 符 和 表达 式 
Python 的 内 置 运 算 符 人 允许 用 各 种 熟悉 的 方式 对 值 进行 操作 和 组 合 。 


Brenti(3 + 4) # PEints 7 which Ls 3 Blis 4 


print(Ss = 6) # Peints "=1", whiceh is 5 minas 和 
Brinttr 交 人 # Prints "S56", whickh is 7 times. 8 
print (45 / 4) # Prints "11.25", which is 45 divided by 4 


print2 ** 10) # Prints "1024", which is 2 to the 10th power 


当 一 个 操作 (如 45 除 以 4) 产生 的 是 非 整 数 结果 (如 11.25)〉 时 ，Python 会 将 表示 类 型 隐 式 
转换 为 浮 点 表示 。 如 果 希 望 结果 是 整数 ， 就 要 使 用 另外 一 组 运算 符 。 

print(45 // 4) # Prints "11", which is 45 integer divided by 4 

print(45 $ 4) 由 Prints "li" becGause 和 十 了 三 45 

双 斜 线 (//) 表示 整除 (integer floor division) 运算 符 ， 百 分 号 (%) 表示 取 模 (modulus) 
或 取 余 运算 符 。 将 这 两 个 计算 综合 起 来 ， 可 读 作 :“4 除 45 等 于 11， 余数 为 1。” 在 前 面 的 示例 中 ， 
我 们 用 ** 表 示 窜 运算 符 ， 这 看 起 来 可 能 有 些 奇 怪 ， 因 为 在 打印 文本 甚至 一 些 其 他 程序 设计 语言 
中 , 窜 运 算 符 一 般 都 是 用 插入 符号 (^) 表示 。 在 Python 中 ,“^ 运 算 符 是 一 种 按 位 布尔 运算 (bitwise 
Boolean operation) 运算 符 ， 有 关 按 位 布尔 运算 的 内 容 将 在 下 一 章 中 介绍 。 

还 可 以 用 一 些 直观 的 方式 对 字符 串 值 进行 组 合 和 操作 。 


8 三 “hielle" + "world’ 
七 硅 半 到 
BrEint (rt) # Prints "helloworldhelloworldhelloworldhelloworld" 


其 中 ， 加 (+) 运算 符 用 于 拼接 (concatenate) 字符 串 值 ， 乘 (*) 运算 符 用 于 复制 (replicate) 
字符 串 值 。 

有 些 内 置 运算 符 的 多 重 含义 会 导致 混淆 。 下 面 这 个 脚本 会 产 出 一 个 错误 ， 

print('USD$' + 1000) # TypeError: Can't convert "int" to str implicitly 


这 个 错误 指出 ， 字 符 串 拼接 运算 符 不 知道 在 第 二 个 操作 数 不 是 字符 串 的 情况 下 要 怎么 做 。 不 过 
幸运 的 是 ，Python 提 供 了 人 允许 将 值 从 一 种 表示 类 型 转换 为 另外 一 种 表示 类 型 的 函数 。int () 函 
数 能 把 浮 点 型 值 转换 回 整 数 表示 ， 丢 弃 小 数 部 分 。 如 果 字 符 串 可 以 正确 地 拼 出 一 个 有 效 数 字 ， 
那么 int () 函数 还 能 将 一 个 文本 数字 串 转换 为 一 个 整数 表示 。 同 样 地 ，stz () 函数 能 把 数字 表 
示 转 换 成 UTF-8 编 码 的 文本 串 。 因 此 ， 对 上 述 print 语 句 做 如 下 修改 就 能 改正 错误 。 
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print ('USD$" + str(1000)) # Prints "USD$1000" 


1.8.5 ”货币 转换 


下 面 这 个 完整 的 Python 脚 本 示例 演示 了 许多 本 节 要 介绍 的 概念 。 给 定 一 定数 量 的 美元 ， 脚 
本 会 对 其 进行 货币 转换 ， 转 换 成 4 种 其 他 货币 。 


# A converter for international currency exchange. 

USD to GBP = 0.66 # Today’'s rate, US dollars to British Pounds 
USD to EUR = 0.77 # Today's rate, US dollars to Euros 
USD to JPY = 99.18 # Today's rate, US dollars to Japanese Yen 
USD to INR = 59.52 # Today's rate, US dollars to Indian Rupees 


GBP sign = '\u00A3' # Unicode values for non-ASCIT currency symbols. 
EUR sign = '\u20AC' 

JPY sign = '\u00AS' 

INR sign = '\u20B9' 

dollars = 1000 # The number of dollars to convert 

pounds = dollars * USD to _ GBP # Conversion calculations 

euros = dollars * USD to EUR 

yen = dollars * USD to JPY 

rupees = dollars * USD to INR 

print('Today, $' + str(dollars)) # Printing the results 


print('converts to ' + GBP sign str (pounds)) 


print('converts to ' 


十 

EUR sign + str(euros)) 
+ str (yen)) 
+ 


十 
print('converts to ' + JPY sign 
BEiAit ("converts to " + 


执行 该 脚本 时 ， 输 出 如 下 : 


Today, $1000 
converts to £660.0 
converts to €770.0 
Converts to ¥99180.0 
converts to 3159520.0 


1.8.6 ”调试 


程序 设计 语言 对 初学 者 不 是 很 宽容 ,初学 者 在 编写 软件 时 ， 需 要 花费 大 量 的 时 间 努 力 查 找 代 码 中 
的 bug 或 者 错误 。 软 件 中 的 bug 可 分 为 3 大 类 : 语法 错误 〈syntax error， 键 入 时 产生 的 符号 错误 )、 语 义 
错误 (semantic error， 程 序 含义 的 错误 ) 和 运行 时 错误 (runtime error， 程 序 运 行 时 发 生 的 错误 )。 

对 于 新 手 来 说 ， 语 法 错误 是 最 常见 的 ， 包 括 一 些 简单 的 错误 ， 如 忘记 文本 串 开 头 或 者 结尾 
的 其 中 一 个 引号 ， 没 有 关闭 开 括 号 ,或 者 拼 错 函 数 名 print。 当 Python 解 释 器 遇 到 这 些 错误 时 ， 
通常 会 努力 指出 这 些 错误 ， 显 示 问 题 代码 所 在 行 的 行 号 以 及 问题 描述 。 经 过 一 些 练习 之 后 ， 初 
学 者 能 很 快 学 会 识别 和 解释 常见 的 错误 情况 。 下 面 来 看 儿 个 例子 : 


rint(F 4 ) 


INR sign str (UPees) ) 


SyntaxError: invalid syntax 


上 述 表 达 式 在 加 法 运算 符 和 闭 括号 之 间 缺 少 一 个 值 。 
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print (S.e) 

SyntaxError: invalid token 
Python 希 望 小 数 点 后 面 是 数字 ， 而 不 是 字母 。 

Deontts) 

NameError: name 'pront' is not defined 
就 像 叫 错 一 个 人 的 名 字 一 样 ， 拼 错 已 知 函数 或 变量 的 名 字 会 产生 混淆 复 粹 。 

语义 错误 是 算法 中 的 缺陷 ， 或 者 某 种 语言 表达 算法 方式 中 的 缺陷 。 这 样 的 例子 可 能 包括 : 
在 一 个 计算 中 使 用 了 错误 的 变量 ， 或 者 弄 错 了 复杂 表达 式 中 算术 运算 符 的 顺序 。Python 遵 循 运 
算 符 优先 级 的 标准 规则 ， 所 以 在 像 total pay = 40 + extra hours * pay_rate 这 样 的 表 
达 式 中 ， 乘 法 会 在 加 法 之 前 执行 ， 错 误 地 计算 总 工资 。( 除 非 你 的 工资 率 恰好 是 1 美元 /小 时 。) 
使 用 括号 正确 地 指定 复杂 表达 式 中 的 运算 顺序 ， 如 total pay = (40 + extra hours) * 
pay_rate， 既 可 以 避免 语义 错误 ， 又 可 以 避免 写 出 的 代码 难于 理解 。 

最 后 ， 这 个 层次 上 的 运行 时 错误 可 能 包括 : 无 意识 地 除 以 0， 或 者 使 用 未 定义 的 变量 。Python 
是 从 上 到 下 读 取 语句 的 ， 在 表达 式 里 使 用 变量 之 前 ，Python 必 须 看 到 变量 的 赋值 语句 。 

测试 是 高 效 编写 Python 脚本 《或 者 任何 种 类 的 实际 程序 ) 必 不 可 少 的 一 部 分 。 在 编写 脚本 
时 要 频繁 运行 它 ， 可 能 每 完成 一 行 代码 就 需要 运行 一 次 。 这 样 做 能 尽早 识别 和 修复 语法 错误 ， 
把 程序 设计 者 的 注意 力 集中 在 脚本 每 一 步 应 该 做 什么 上 。 





问题 与 练习 

1. 是 什么 使 Python 成 为 一 门 解释 型 程序 设计 语言 ? 

2. 编写 Python 语句 输出 下 列 内 容 。 
a，“Computer Science Rocks” 这 些 词 ， 后 面 跟 一 个 感叹 号 。 
b. 数字 42。 
c. 的 近似 值 ， 精 确 到 小 数 点 后 第 4 位 。 

3. 编写 Python 语 句 按 下 列 描述 给 变量 赋值 。 
a. 将 “programmer” 这 个 词 赋 值 给 一 个 名 为 rockstar 的 变量 。 
b. 将 1 小 时 的 秒 数 赋值 给 一 个 名 为 seconds_per_hour 的 变量 。 
c. 将 人 体 的 平均 温度 赋值 给 一 个 名 为 bodyTemp 的 变量 。 

4. 编写 一 条 Python 语 句 ， 给 定 一 个 已 有 的 名 为 podyTemp 的 变量 ， 单位 为 华氏 度 ， 将 与 其 相等 的 组 度 
存储 到 一 个 名 为 metricBodyTemp 的 新 变量 中 。 


为 了 存储 或 传输 数据 ， 在 保留 原 有 内 容 的 同时 ， 缩 小 所 涉及 数据 的 大 小 是 有 益 的 《有 时 也 
是 必须 的 )。 用 于 完成 这 一 过 程 的 技术 称 为 数据 压缩 (data compression)。 本 节 ， 我 们 首先 要 学 
一 些 普通 的 数据 压缩 方法 ， 然 后 要 了 解 一 些 为 特殊 应 用 设计 的 方法 。 


1.9.1 通用 的 数据 压缩 技术 


数据 压缩 方案 有 两 类 ， 一 类 是 无 损 的 〈lossless)， 另 一 类 是 有 损 的 〈lossy)。 无 损 方案 在 压 
缩 过 程 中 是 不 丢失 信息 的 ， 有 损 方案 在 压缩 过 程 中 会 丢失 信息 。 通 常 有 损 技术 比 无 损 技 术 更 能 
压缩 ， 因 此 在 可 以 容忍 小 错误 的 应 用 中 很 流行 ， 如 图 像 和 音频 压缩 。 
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对 于 被 压缩 数据 由 一 长 串 相 同 的 数值 组 成 的 情况 ， 普 遍 使 用 称 为 行程 长 度 编码 (run-length 
encoding) 的 压缩 技术 ， 这 是 一 种 无 损 方法 。 它 的 过 程 是 ， 将 一 组 相同 的 数据 成 分 替换 成 一 个 
编码 ， 指 出 重复 的 成 分 以 及 其 在 序列 中 出 现 的 次 数 。 例 如 ， 指 出 一 个 位 模式 包括 253 个 1， 接 着 
118 个 0， 接 着 87 个 1， 这 样 要 比 实际 列 出 458 个 位 节省 空间 。 

另外 一 种 无 损 数 据 压缩 技术 是 频率 相关 编码 〈frequency-dependent encoding)， 在 这 个 系统 
里 ， 用 于 表示 数据 项 的 位 模式 的 长 度 与 这 个 项 的 使 用 频率 是 反 相 关 的 。 这 种 编码 是 变 长 编码 的 
例子 , 意思 是 项 由 不 同 长 度 的 模式 表示 。 戴 维 ， 赫 夫 曼 的 功劳 是 发 现 了 一 般 用 于 开发 频率 相关 
编码 的 算法 ， 人 们 一 般 称 用 这 种 方法 开发 的 编码 为 赫 夫 曼 编 码 “(Huffman code)。 因 此 ， 现 在 
使 用 的 大 多 数 频 率 相 关 编 码 都 是 赫 夫 曼 编 码 。 

让 我 们 看 一 个 频率 相关 编码 的 例子 ， 考 虑 一 下 编码 英文 文本 的 任务 。 在 英文 中 ， 字 母 e、t、 
a 和 i 的 使 用 频率 要 大 于 字母 z-、q 和 和 x。 因此， 当 为 英文 文本 编码 时 ， 如 果 用 短 位 模式 表示 前 面 的 
字母 ， 用 长 位 模式 表示 后 面 的 字母 ， 那 么 就 能 节省 空间 。 结 果 得 到 的 编码 中 ， 英 文 文本 的 表示 
长 度 要 比 用 统一 长 度 编码 时 的 短 。 

在 某 些 情况 下 ， 压 缩 的 数据 流 由 各 个 数据 单元 组 成 ， 每 一 个 数据 单元 与 其 前 面 一 个 差别 很 
小 。 动 画 的 连续 帧 就 是 一 个 例子 。 这 时 ， 使 用 相对 编码 (relative encoding) 一 一 也 称 为 差分 编 
码 (differential encoding) 一 一 技术 是 很 有 用 的 。 这 些 技术 记录 下 了 两 个 连续 数据 单元 之 间 的 区 别 ， 
而 不 是 全 部 单元 ; 也 就 是 说 ， 每 个 单元 是 根据 其 与 前 一 个 单元 的 关系 被 编码 的 。 相 对 编码 用 无 损 形 
式 或 有 损 形式 都 可 以 实现 ， 有 具体 取决 于 两 个 连续 数据 单元 之 间 的 差别 是 精确 编码 还 是 近似 编码 。 

还 有 其 他 流行 的 基于 字典 编码 (dictionary encoding) 技术 的 压缩 系统 ， 这 里 的 术语 字典 
Cdictionary) 指 的 是 一 组 构造 块 ， 压 缩 的 信息 通过 它们 建造 起 来 ,而 信息 本 身 被 编码 成 字典 的 
一 系列 参照 符 。 我 们 一 般 认为 字典 编码 系统 是 无 损 系统 ， 不 过 在 学 习 图 像 压缩 时 我 们 将 看 到 ， 
有 时 候 字 典 条 目 仅仅 是 正确 数据 成 分 的 近似 值 ， 这 就 使 其 成 了 有 损 压缩 系统 。 

字 处 理 程 序 可 以 使 用 字典 编码 来 压缩 文本 文档 ， 因 为 这 些 字 处 理 程序 中 已 经 包含 了 用 于 拼 
写 检 查 的 字典 ， 而 这 些 字典 都 是 出 色 的 压缩 字典 。 特 别 值得 一 提 的 是 ， 一 个 完整 的 单词 可 以 编 
码 成 字典 的 一 个 单独 参照 符 ， 而 不 是 像 使 用 UTF-8 系 统 那 样 编码 成 一 系列 单独 的 字符 。 在 字 处 
理 程 序 中 , 一 个 典型 的 字典 大 约 有 25 000 个 条 目 , 这 就 意味 着 , 单个 的 字典 条 目 可 以 用 0 到 24 999 
范围 内 的 整数 来 标识 。 也 就 是 说 ， 字 典 中 的 一 个 特定 条 目 用 1$ 位 的 模式 就 足 可 标识 。 相 反 ， 如 
果 用 到 的 单词 包括 6 个 字母 ， 则 它 的 逐 字 符 编 码 在 使 用 UTF-8 时 需要 48 位 。 

字典 编码 的 一 个 变 体 是 自 适应 字典 编码 (adaptive dictionary encoding, 也 称 动态 字典 编码 )。 
在 自 适应 字典 编码 系统 中 ， 字 典 在 编码 过 程 中 是 可 以 改变 的 。 一 个 流行 的 例子 是 LZW 编 码 
(Lempel-Ziv-Welsh encoding )， 这 个 编码 的 名 称 是 根据 它 的 创造 者 Abraham Lempel、Jacob Ziv 
和 Terry Welsh 的 姓氏 命名 的 。 要 用 LZW 对 信息 编码 ， 首 先 要 从 包含 基础 构造 块 的 字典 开始 ， 用 字典 
中 的 构造 块 来 构造 信息 。 但是， 当 和 人们 在 信息 中 发 现 更 大 的 单元 时 ,会 把 它们 加 到 字典 上 一 一 这 意 
味 着 ， 这 些 单元 在 未 来 出 现时 可 以 被 编码 为 一 个 (而 不 是 多 个 ) 字典 参照 符 。 例 如 ， 当 对 英文 
文本 编码 时 ， 人 们 首先 要 从 包含 单独 字符 、 数 字 和 标点 符号 的 字典 开始 。 但 是 ， 当 信息 中 的 单 
词 被 标识 后 ， 会 被 加 到 字典 中 。 因 此 ， 随 着 信息 的 不 断 编码 ， 字 和 典 会 不 断 增 大 ， 而 随 着 字典 的 
不 断 增 大 ， 信 息 中 会 有 更 多 的 单词 〈 或 者 重复 的 单词 模式 ) 被 编码 为 单个 的 字典 参照 符 。 

结果 是 ， 信 息 用 一 部 相当 大 的 、 完 全 针对 本 信息 的 字典 进行 编码 。 但 是 在 对 这 条 信息 进行 
解码 时 ， 不 必用 这 个 大 字典 ， 只 需要 用 原始 的 小 字典 即 可 。 事 实 上 ， 解 码 过 程 可 以 与 编码 过 程 
用 同一 个 小 字典 。 接 着 ， 随 着 解码 进程 的 继续 ， 会 过 到 编码 过 程 中 发 现 的 相同 单元 ， 因 此 可 以 
将 它们 加 到 字典 中 ， 作 为 未 来 编码 过 程 的 参照 符 。 

举例 说 明 ， 考 虑 对 下 列 信息 应 用 LZW 编 码 : 
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XYxX KYyx XYX XY 


首先 从 一 个 只 有 3 个 条 目的 字典 开始 ， 第 1 个 条 目 是 x:， 第 2 个 条 目 是 y， 第 3 个 条 目 是 空格 。 我 们 
先 将 xyx 编 码 为 121， 意思 是 这 个 信息 的 第 一 个 模式 依次 包括 第 一 个 字典 条 目 、 第 二 个 字典 条 目 、 
第 一 个 字典 条 目 。 接 着 ， 空 格 被 编码 产生 结果 1213。 但 是 因为 有 了 一 个 空格 ， 我 们 知道 前 面 的 
字符 串 已 经 形成 了 一 个 单词 ， 所 以 我 们 将 模式 xyx 加 到 字典 里 作为 第 4 个 条 目 。 继 续 使 用 这 种 编 
码 方式 ， 整 个 信息 将 被 编码 为 121343434。 

如 果 我 们 现在 从 原始 的 3 条 目 字典 开始 对 这 条 信息 进行 解码 , 那么 我 们 首先 要 将 起 始 的 1213 
串 解码 为 zx 加 1 个 空格 。 这 时 我 们 意识 到 xx 串 形成 了 一 个 单词 ， 因 此 将 其 加 到 字典 中 作为 第 4 
个 条 目 ， 同 编码 过 程 中 所 做 的 一 样 。 我 们 接着 对 这 个 信息 解码 ， 发 现 信息 中 的 4 指 的 是 这 第 4 个 
新 条 目 ， 将 其 解码 为 单词 gx， 因 此 产生 模式 : 


XY XY 


继续 使 用 这 种 解码 方式 ， 我 们 最 终 把 121343434 串 解码 为 : 


XYX  XYX XYyx Xyx 


这 就 是 原始 信息 。 
1.9.2 ”图像 压缩 


在 1.4 节 中 , 我 们 已 经 看 到 如 何 用 位 图 技术 对 图 像 编码 。 不 过 , 得 到 的 位 图 通常 是 非常 大 的 。 
因此 ， 人 们 专门 为 图 像 表 示 开 发 出 了 许多 压缩 方案 。 

一 种 称 为 GIF (是 graphic interchange format 的 缩写 ， 即 图 像 交 换 格 式 ， 一 些 人 将 其 读 作 
“Gi 人 f”， 还 有 一 些 人 将 其 读 作 “Jif”) 的 系统 是 一 个 字典 编码 系统 ， 由 CompuServe 公 司 研制 开 
发 。 它 处 理 压 缩 问题 的 方法 是 , 将 赋予 一 个 像素 的 颜色 数量 减少 到 只 有 256 个 。 每 一 种 颜色 的 “ 红 
- 绿 - 蓝 ” 组 合 都 用 3 个 字 节 编码 ， 这 256 个 编码 被 存储 在 一 个 称 为 调 色 板 的 表格 〈 一 个 字典 ) 里 。 
图 像 中 的 每 个 像素 都 可 以 用 一 个 字 节 表示 , 该 字 节 的 值 指出 了 这 个 像素 的 颜色 是 由 256 个 调 色 板 
条 目 中 的 哪 一 个 表示 的 。( 回 顾 : 一 个 字 节 能 够 包括 256 个 不 同位 模式 中 的 任意 一 个 。) 需要 注意 
的 是 ， 在 将 GIF 应 用 于 任意 图 像 时 ， 它 是 一 个 有 损 压缩 系统 ， 因 为 调 色 板 中 的 颜色 可 能 与 原始 
图 像 中 的 颜色 不 一 致 。 

通过 使 用 LZW 技 术 将 这 个 简单 的 字典 系统 扩展 为 自 适 应 字典 系统 ，GIF 可 以 进一步 压缩 。 
尤其 是 ， 编 码 过 程 中 遇 到 的 像素 模式 可 以 被 加 到 字典 中 ， 使 得 这 些 模式 在 将 来 出 现时 可 以 被 更 
加 高 效 地 编码 。 因 此 ， 最 终 的 字典 是 由 原始 调 色 板 和 一 组 像素 模式 构成 的 。 

GIF 调 色 板 中 的 某 一 个 颜色 通常 会 被 赋予 值 “透明 ”， 意 思 是 背景 色 可 以 透 过 每 一 个 被 赋予 
该 “颜色 ”的 区 域 表 现 出 来 。 这 个 选择 ， 与 GIF 系统 的 相对 简便 性 相 结合 ， 使 得 GIF 成 为 简单 动 
画 应 用 (这 动画 应 用 中 的 多 重 图 像 必 须 在 计算 机 屏幕 上 移动 ) 的 合理 选择 。 另 一 方面 ， 它 只 能 
够 对 256 种 颜色 编码 ， 这 使 得 它 不 适合 精确 度 要 求 较 高 的 应 用 ， 如 摄影 领域 。 

另外 一 种 流行 的 图 像 压缩 系统 是 JPEG ( 读 作 “JAY-peg”)。 它 是 由 ISO 中 的 联合 图 像 专家 组 
(Joint Photographic Experts Group， 标 准 因 此 得 名 ) 研制 开发 的 标准 。JPEG 已 经 被 证 明 是 压缩 彩 
色 照 片 的 一 种 有 效 标 准 ， 并 被 广泛 用 于 摄影 业 ， 这 一 点 可 由 大 多 数 数 码 相 机 都 将 了 PEG 作 为 它们 
默认 的 压缩 技术 这 一 事实 来 证 明 。 

JPEG 标 准 实际 上 包含 多 种 图 像 压缩 方法 ， 每 种 都 有 它 自己 的 目标 。 在 需要 绝对 精确 的 情况 
下 ，JPEG 可 提供 无 损 模式。 不 过 ， 相 对 于 JPEG 的 其 他 模式 ，JPEG 的 无 损 模式 不 能 形成 高 级 别 
的 压缩 。 而 且 ,，JPEG 的 其 他 模式 已 被 证 明 很 成 功 ， 这 就 意味 着 人 们 很 少 使 用 其 无 损 模 式 。 相 反 ， 
称 为 J 了 PEG 基 线 标准 〈 也 称 为 JPEG 的 有 损 顺 序 模 式 ) 的 JPEG 模 式 已 经 成 为 许多 应 用 的 选择 标准 。 
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使 用 JPEG 基 线 标准 的 图 像 压 缩 有 儿 个 步骤 ， 其 中 有 一 些 是 利用 人 眼 的 局 限 性 设计 的 。 尤 其 
是 ， 相 对 于 颜色 的 变化 ， 人 眼 对 亮度 的 变化 更 为 敏感 。 因 此 ， 我 们 首先 来 看 一 幅 用 亮度 成 分 和 
色 度 成 分 进行 编码 的 图 像 。 第 一 步 是 在 一 个 2X2 的 像素 方块 中 求 色 度 的 平均 值 。 这 能 将 色 度 信 


息 的 大 小 减 小 为 二 ， 同时 保留 所 有 的 原始 亮度 信息 。 结 果 是 ， 在 没有 明显 损失 图 像 质量 的 情况 


下 获得 了 很 高 的 压缩 率 。 

下 一 步 是 将 图 像 划 分 成 8X 8 的 像素 块 ， 然 后 将 每 一 个 块 作为 一 个 单元 来 压缩 信息 。 这 是 通 
过 一 种 称 为 离散 余弦 转换 的 数学 技术 实现 的 ， 我 们 现在 不 需要 关心 这 个 转换 的 细节 。 更 重要 的 
是 ， 这 种 转换 将 原始 的 8X8 块 变 成 了 另外 一 种 块 〈 这 种 块 中 的 条 目 反 映 了 原始 块 中 的 像素 之 间 
是 如 何 相 互联 系 的 )， 而 不 是 实际 像素 值 。 在 这 个 新 块 里 ， 那 些 低 于 预定 极限 的 数值 将 被 0 替代 ， 
反映 的 是 这 些 数值 所 表示 出 的 变化 非常 小 ， 人 眼 无 法 觉察 。 例 如 ， 如 果 原 始 块 中 包含 一 个 棋盘 
(checkerboard) 模式 ， 那 么 新 块 就 可 能 表现 为 平均 色 。( 一 个 典型 的 8 X 8 像素 块 表示 的 是 图 像 
中 一 个 非常 小 的 方块 ， 因 此 人 眼 根本 不 能 够 识别 棋盘 的 外 观 。) 

这 时 候 ， 可 以 应 用 更 传统 的 行程 长 度 编 码 、 相 对 编码 以 及 变 长 编码 技术 进行 进一步 的 压缩 。 
总 之 ，JPEG 基 线 标准 一 般 能 在 没有 明显 质量 损失 的 情况 下 ， 将 彩色 图 像 压 缩 至 少 10 倍 ， 有 时 甚 
至 能 压缩 30 倍 。 

另外 一 个 数据 压缩 系统 是 TIFF (tagged image file format 的 缩写 ， 即 标记 图 像 文件 格式 )。 不 
过 ，TIFF 最 普遍 的 应 用 不 是 数据 压缩 ， 而 是 存储 照片 及 其 相关 的 信息 〈 如 日 期 、 时 间 以 及 相机 设 
置 ) 的 一 个 标准 格式 。 在 存储 照片 时 ， 图 像 本 身 通 常会 被 存储 为 没有 压缩 的 红 、 绿 、 蓝 像素 成 分 。 

TIFF 标 准 集合 里 的 确 有 数据 压缩 技术 ， 其 中 大 多 数 是 为 在 传真 应 用 中 压缩 文本 文档 的 图 像 设 计 
的 。 为 了 利用 文本 文档 包含 长 串 的 白色 像素 这 一 事实 ， 这 些 标 准 使 用 了 行程 长 度 编码 的 变 体 。TIFF 
标准 中 的 彩色 图 像 压 缩 选 择 是 以 类 似 于 GIF 所 使 用 的 技术 为 基础 的 , 因此 并 没有 被 广泛 应 用 于 摄影 业 。 


1.9.3 “音频 和 视频 压缩 


音频 及 视频 的 编码 和 压缩 最 常用 的 标准 是 由 ISO 领导 的 运动 图 像 专家 组 (Motion Picture 
Experts Group，MPEG) 研制 开发 的 ， 因 此 这 些 标准 称 为 MPEG 。 

MPEG 包 含 许 多 不 同 应 用 的 各 种 标准 。 例 如 ,高 清晰 度 电 视 (high definition television,HDTYV ) 
广播 的 要 求 与 视频 会 议 的 就 不 同 ， 广 播 信号 必须 找到 在 各 种 容量 可 能 很 有 限 的 通信 路 径 上 传输 
的 方式 。 另 外 ， 这 两 种 应 用 又 都 不 同 于 存储 视频 的 应 用 ， 它 的 有 些 部 分 可 以 被 重 放 或 略 过 。 

MPEG 使 用 的 技术 已 经 超出 了 本 书 的 范围 ， 但 是 一 般 说 来 ， 视 频 压 缩 技 术 是 以 图 片 序 列 构 
建成 的 视频 为 基础 的 ， 与 将 运动 图 像 录 制 到 胶片 上 的 方式 基本 相同 。 为 了 压缩 这 些 序 列 ， 只 有 
一 部 分 称 为 I 帧 (I-frame) 的 图 片 是 被 整个 编码 的 。 在 两 个 I 帧 之 间 的 图 片 是 采用 相对 编码 技术 
进行 编码 的 ， 即 并 没有 对 整个 图 片 进行 编码 ， 而 只 是 记录 了 与 前 一 个 图 片 的 差别 。I 帧 本 身 经 常 
使 用 类 似 于 JPEG 的 技术 压缩 。 

最 著名 的 音频 压缩 系统 是 MP3， 它 是 在 MPEG 标 准 中 开发 出 来 的 。 事 实 上 ，MP3 是 MPEG 
layer 3 的 缩写 。 与 其 他 压缩 技术 相 比 ，MP3 利 用 人 耳 的 特性 ， 删 除了 人 耳 觉察 不 到 的 细节 。 其 
中 一 个 特性 称 为 暂时 模糊 (temporal masking)， 指 的 是 在 一 次 巨大 声响 后 ， 短 时 间 内 人 耳 觉 察 
不 到 本 可 以 听见 的 轻柔 声音 。 另 一 个 称 为 频率 模糊 (frequency masking)， 指 的 是 某 一 频率 的 声 
音 可 能 掩盖 相近 频率 的 轻柔 声音 。 利 用 这 些 特性 ， 可 以 通过 MP3 获 得 显著 的 音频 压缩 ， 而 且 保 
持 接 近 CD 的 音质 。 

使 用 MPEG 和 MP3 压 缩 技术 , 摄像 机 用 128 MB 的 存储 空间 就 可 以 录制 长 达 1 小 时 的 视频 , 便 
携 音 乐 播放 器 用 1 GB 的 存储 空间 就 可 以 存储 多 达 400 首 流行 歌曲 。 但 是 ， 不 同 于 其 他 压缩 目的 ， 
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音频 和 视频 的 压缩 目的 不 一 定 是 节省 存储 空间 。 真 正 重 要 的 是 获得 编码 ， 使 得 信息 能 够 通过 
现在 的 通信 系统 得 到 及 时 的 传输 。 如 果 每 一 个 视频 帧 需要 1 MB 的 存储 空间 ， 而 传播 帧 的 通信 路 
径 每 秒 只 能 传输 1 KB， 那 么 根本 无 法 实现 成 功 的 视频 会 议 。 因 此 ， 除 了 被 认可 的 复制 质量 ， 音 
频 和 视频 压缩 系统 的 选择 还 要 看 及 时 数据 通信 的 传输 速度 。 这 些 速度 通常 用 比特 每 秒 (bits per 
second，bit/s) 来 度量 。 常 见 的 单位 包括 Kbit/s (kilo-bps 的 简写 ， 即 千 比 特 每 秒 ， 等 于 103 bit/s)、 
Mbit/s (mega-bps 的 简写 ， 即 兆 比特 每 秒 ， 等 于 10"bps) 和 Gbits (giga-bps 的 简写 ， 即 吉 比 特 每 
秒 , 等 于 10? bit/s)。 使 用 MPEG 技 术 , 视频 展示 可 以 在 40 Mbit/s 传 输 速率 的 通信 路 径 上 成 功 传输 。 
MP3 录 制 需 要 的 传输 速率 一 般 不 超过 64 Kbit/s。 


问题 与 练习 


1. 列 出 4 种 通用 的 压缩 技术 。 
2. 如 果 使 用 LZW 压 缩 ， 并 且 最 初 字典 只 包含 *、y 和 一 个 空格 (如 文中 所 述 )， 对 下 列 信息 编码 ， 结 果 是 
什么 ? 


XYX YXXXY XYX YXXXY YXXXY 


3. 在 对 彩色 卡通 编码 时 ， 为 什么 GIF 比 JPEG 要 好 ? 

4. 假设 你 是 航天 器 设计 团队 的 一 员 ， 要 设计 能 驶 向 其 他 星球 并 发 回 照片 的 航天 器 。 那 么 ， 为 了 减少 存 
储 和 传输 图 像 所 需 的 资源 ， 使 用 GIF 或 JPEG 的 基准 标准 压缩 照片 是 否 是 一 个 好 主意 ? 

. JPEG 的 基准 标准 利用 了 人 眼 的 什么 特性 ? 

6. MP3 利 用 了 人 和 耳 的 什么 特性 ? 

. 说 出 一 种 在 把 数字 信息 、 图 像 和 声音 编码 为 位 模式 时 常见 的 麻烦 现象 。 
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当 信息 在 一 台 计 算 机 的 各 个 部 分 之 间 来 回 传 输 ， 或 在 月 球 和 地 球 之 间 来 回 传输 ， 又 或 者 只 
是 被 保存 在 存储 器 中 时 ， 最 终 检索 到 的 位 模式 有 可 能 和 最 原始 的 不 一 致 。 灰 尘 颗粒 、 磁 记录 面 
的 油脂 或 者 出 了 故障 的 电路 ， 都 可 能 使 数据 被 错误 地 记录 或 读 取 。 传 输 通 道上 的 静电 干扰 可 能 
会 损坏 部 分 数据 。 在 某 些 技术 条 件 下 ， 普 通 的 背景 辐射 (background radiation) 可 以 改变 存储 在 
机 器 主 存储 器 中 的 模式 。 

为 了 解决 这 样 的 问题 ， 人 们 开发 了 许多 编码 技术 来 检测 甚至 校正 错误 。 现 在 ， 由 于 这 些 技术 被 
大 规模 地 内 置 于 计算 机 系统 的 内 部 构件 中 ， 所 以 计算 机 的 使 用 者 们 并 不 了 解 它们 。 不 过 ， 它 们 是 很 
重要 的 ， 为 科学 研究 作出 了 很 大 的 贡献 。 因 此 ， 我 们 有 必要 了 解 其 中 一 些 使 现在 设备 可 靠 的 技术 。 


1.10.1 奇偶 校 验 位 


有 一 种 简单 的 差错 检测 方法 ， 其 依据 的 原则 是 : 如 果 被 操作 的 每 个 位 模式 都 有 奇数 个 1， 但 
却 遇 到 了 有 偶数 个 1 的 模式 ， 那 么 一 定 是 出 错 了 。 要 使 用 这 个 原则 ， 需 要 编码 系统 中 的 每 个 模式 
有 奇数 个 1。 这 是 很 容易 做 到 的 ， 首 先 在 已 经 可 用 的 编码 系统 中 的 模式 (也 许 在 高 位 端 ) 上 添加 
一 个 称 为 奇偶 校 验 位 (parity bit) 的 附加 位 。 根 据 不 同情 况 ， 我 们 给 这 个 新 的 位 赋值 1 或 09， 使 
整个 模式 有 奇数 个 1。 当 我 们 这 样 调整 了 编码 系统 后 ， 如 果 出 现 有 偶数 个 1 的 模式 ， 就 表示 出 现 
了 错误 ， 被 操作 的 模式 是 不 正确 的 。 

图 1-26 展 示 了 如 何 将 奇偶 校 验 位 加 到 字母 A 和 F 的 ASCII 码 上 。 注 意 ，A 的 编码 变 成 了 
101000001 (奇偶 校 验 位 为 1 )，F 的 ASCII 码 变 成 了 001000110 (奇偶 校 验 位 为 0)。 尽 管 A 原 始 的 8 
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位 模式 有 偶数 个 1，F 原 始 的 8 位 模式 有 奇数 个 1， 但 它们 的 9 位 模式 都 有 奇数 个 1。 如 果 将 这 种 技 
术 应 用 于 所 有 的 8 位 ASCII 模 式 ， 我 们 就 能 够 得 到 一 个 9 位 编码 系统 ， 其 中 任何 一 个 9 位 模式 有 侦 
数 个 1 就 表示 出 错 了 。 


奇偶 校 验 位 奇偶 校 验 位 
A 的 ASCII 码 含有 偶数 个 1 FE 的 ASCH 码 含有 奇数 个 1 
| 

















[ | EE 
W01000001 四 "1000110 
整个 位 模式 含有 奇数 个 1 整个 位 模式 含有 奇数 个 1 


图 1-26 适用 奇 校 验 的 字母 A 和 F 的 ASCII 码 


上 面 描述 的 奇偶 校 验 系统 称 为 奇 校 验 (odd parity), 因为 我 们 设计 的 系统 中 每 一 个 正确 的 模 
式 都 有 奇数 个 1。 另 一 种 技术 称 为 偶 校 验 (even parity)。 在 偶 校 验 系统 中 ， 每 个 模式 都 会 被 设计 
成 包含 偶数 个 1， 因 此 ， 如 果 出 现 了 奇数 个 1， 就 表明 有 错误 。 

现在 ， 在 计算 机 主 存储 器 中 使 用 奇偶 校 验 位 已 经 不 是 一 件 稀奇 的 事 了 。 尽 管 我 们 假设 这 些 
计算 机 存储 单元 是 8 位 的 ， 但 事实 上 ， 它 们 可 能 是 9 位 ， 其 中 一 个 位 被 用 作 奇 偶 校 验 位 。 每 次 存 
储 器 电路 收 到 要 存储 的 8 位 模式 ， 都 会 先 给 其 加 上 一 个 奇偶 校 验 位 ， 形 成 9 位 模式 , 然后 再 存储 。 
稍 后 检索 模式 时 ， 存 储 器 电路 会 检查 这 个 9 位 模式 的 奇偶 性 。 如 果 检 查 没有 发 现 错误 ， 存储 器 会 
移 除 校 验 位 ， 然 后 自信 地 返回 余下 的 8 位 模式 。 否 则 ， 存 储 器 会 返回 那 8 个 数据 位 ， 并 警告 返回 
的 模式 可 能 与 原本 委托 给 存储 器 的 模式 不 同 。 

直接 使 用 奇偶 校 验 位 很 简单 ， 不 过 它 有 局 限 性 。 如 果 一 个 模式 最 初 有 奇数 个 1， 并 出 现 了 2 
次 错误 ， 那么 它 就 仍然 有 奇数 个 1， 这 样 校 验 系统 就 无 法 检测 到 这 些 错 误 。 事实 上 ， 直 接 使 用 奇 
偶 校 验 位 并 不 能 发 现 模式 中 的 任何 偶数 个 错误 。 

有 时 会 对 长 位 模式 〈 如 记录 在 磁盘 扇 区 中 的 位 串 ) 应 用 一 种 方法 来 最 大 限度 地 减少 这 类 问 
题 。 在 这 种 情况 下 ,模式 都 有 一 组 奇偶 校 验 位 构成 的 校 验 字 节 (checkbyte)。 校 验 字 节 中 的 每 一 
个 位 都 是 一 个 奇偶 校 验 位 ， 与 散布 于 整个 模式 中 的 一 组 特殊 位 相 联 系 。 例 如 ， 一 个 奇偶 校 验 位 
可 能 与 该 模式 中 从 第 一 个 位 起 的 每 个 第 8 位 相关 联 ， 而 另 一 个 与 该 模式 中 从 第 二 位 起 的 每 个 第 8 
位 相关 联 。 用 这 种 方式 ， 更 容易 检测 到 集中 在 原 模 式 某 个 区 域 中 的 一 些 差 错 ， 因 为 这 些 差 错 会 在 
一 些 奇偶 校 验 位 的 范围 内 。 这 个 校 验 字 节 概 念 的 演变 引出 了 称 为 校 验 和 “checksum) 及 循环 元 余 
校 验 (cyclic redundancy check，CRC) 的 差错 检测 方案 。 


1.10.2 ” 纠 错 码 


虽然 使 用 奇偶 校 验 位 可 以 检测 到 差错 , 但 是 它 不 能 提供 纠正 那个 差错 所 需 的 信息 。 让 很 多 人 感 
到 惊讶 的 是 , 居然 有 人 能 设计 出 既 能 够 检测 出 差错 又 能 够 纠正 差错 的 纠 错 码 (error-correcting code )。 
毕竟 ， 直 觉 告诉 我 们 ， 如 果 不 知 道 信 息 的 内 容 就 无 法 纠正 接收 信息 中 的 错误 ， 但 图 1-27 给 我 们 
展示 了 一 个 具有 这 种 纠 错 特性 的 简单 编码 。 

为 了 明白 这 个 编码 是 如 何 运 作 的， 我 们 先 来 定义 汉 明 距离 Hamming distance)， 这 个 术语 
是 根据 R. W. Hamming 的 姓氏 命名 的 , 由 于 受 20 世 纪 40 年 代 早期 继电器 缺乏 可 靠 性 的 挫折 ,他 开 
始 开创 性 地 研究 纠 错 码 。 两 个 位 模式 之 间 的 汉 明 距离 指 的 是 这 两 个 模式 中 不 相同 位 的 个 数 。 
例如 , 在 图 1-27 的 编码 中 , 表示 A 和 B 的 模式 之 间 的 汉 明 距离 是 4, 而 B 和 C 之 间 的 汉 明 距离 是 3。 
图 1-27 中 的 编码 的 重要 特征 是 ， 任 何 两 个 模式 之 间 的 汉 明 距离 至 少 是 3。 

如 果 用 图 1-27 中 的 某 个 模式 来 修改 单个 位 ， 就 能 检测 到 错误 ， 因 为 结果 不 会 是 一 个 合法 的 
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模式 。( 我 们 必须 至 少 改 变 任意 一 个 模式 的 3 个 位 ， 这 个 模式 才 会 像 另 外 一 个 合法 模式 。) 而 且 ， 
我 们 还 能 够 指出 原始 模式 是 什么 。 毕 竟 ， 修 改过 的 模式 和 其 原始 形式 的 汉 明 距离 是 1， 而 和 其 他 
任何 合法 模式 的 汉 明 距离 至 少 是 2。 

因此 ， 对 最 初 用 图 1-27 编 码 的 信息 解码 ， 我 们 只 需要 简单 地 对 比 接收 到 的 模式 和 用 此 编码 
表示 的 模式 ， 直 到 我 们 找到 一 个 和 接收 到 的 模式 之 间 的 汉 明 距离 是 1 的 模式 为 止 。 我 们 将 其 视 
为 正确 的 符号 进行 解码 。 例 如 ， 我 们 接收 到 位 模式 010100， 并 将 其 与 编码 中 的 模式 相 比 ， 我 
们 就 会 得 到 图 1-28 中 所 示 的 表格 。 因 此 ， 我 们 得 出 结论 ， 传 输 的 字符 一 定 是 D， 因 为 这 是 最 接 
近 的 匹配 。 


符 号 编 码 字 符 编 码 接收 到 的 模式 人 
A 000000 A 000000 om0 Lo a | 
B 001111 Bo OO Mt DO OO 4 
& 010011 CG oFo0ol1l ol oo 3 最 小 
D 011100 D 011q0 .00 L010 和 距离 
至 100110 E 10 0 Ti OO Ole 3 
F 101001 了 WO L000 0 1 0 5 
G 110101 G yon0 .010.00 We 
H 111010 H i111010"0 0 .00 na, 
图 1-27 一 个 纠 错 码 图 1-28 ”用 图 1-27 中 的 编码 对 模式 010100 解 码 


通过 观察 可 以 发 现 ， 使 用 图 1-27 的 编码 技术 ， 每 个 模式 我 们 可 最 多 检测 出 2 个 错误 并 改正 1 个 。 
如 果 我 们 能 设计 出 一 种 编码 ， 使 得 每 个 模式 和 其 他 任何 模式 之 间 的 汉 明 距离 都 至 少 是 5， 那 么 我 们 
就 能 最 多 检测 出 4 个 错误 并 最 多 改正 2 个 。 当 然 , 设计 一 种 具有 长 汉 明 距离 的 编码 并 不 是 一 件 简单 的 事 。 
事实 上 ， 它 是 称 为 代数 编码 理论 的 数学 分 支 的 一 部 分 ， 这 个 理论 是 线性 代数 和 矩阵 理论 的 子 领域 。 

纠 错 技术 被 广泛 用 于 提高 计算 设备 的 可 靠 性 。 例 如 ， 它 们 经 常 被 用 于 大 容量 磁盘 驱动 器 ， 
以 减少 因 磁 盘 表 面 瑕 疲 而 损坏 数据 的 可 能 性 。 此 外 ， 最 初 用 于 音频 盘 的 CD 格式 与 后 来 用 于 计算 
机 数据 存储 的 格式 之 间 的 主要 差别 是 纠 错 的 程度 。CD-DA 格 式 具 有 纠 错 功能 ， 它 能 把 错误 率 减 
gt 有 1 个 错误 。 这 种 格式 非常 适合 于 音频 录制 ， 但 是 对 于 用 CD 向 客户 交付 软件 的 公 

， 若 50% 的 盘 有 刺 病 是 令 人 无 法 忍受 的 。 因 此 ， 附 加 纠 错 功能 被 用 在 CD 中 来 存储 数据 ， 将 错 
er 000 个 盘 1 个 错误 


问题 与 练习 
1. 下 面 的 字 节 最 初 是 用 奇 校 验 编码 的 。 你 知道 它们 中 哪个 出 错 了 吗 ? De 
a.100101101 b.100000001 ©¢.000000000 d.111000000 ee ONLLLLLL 
2. 问题 1 中 没 发 现 错 误 的 字 节 还 会 有 错误 吗 ? 解释 你 的 答案 。 | 
3. 如 果 将 奇 校 验 换 成 偶 校 验 ， 那 么 问题 1 和 问题 2 的 答案 又 将 如 何 ? 
4. 用 带 奇 校 验 的 ASCII 码 对 下 列 语句 编码 ， 在 每 一 个 字符 编码 的 高 位 端 加 一 个 奇偶 校 验 位 。 
a. “Stop!” Cheryl shouted. 
b. Does 2+3=5? 
5. 用 图 1-27 的 纠 错 码 解码 下 面 的 信息 。 
i QOLTEL 00400 001400 
b. 010001 000000 001011 
cc: OLEF010 L10110 .100000 ,011100 


6. 用 长 度 为 5 的 位 模式 ， 为 字符 A、B、C 和 D 构 造 编码 ， 使 得 任何 两 个 模式 之 间 的 汉 明 距 高 至 少 是 3。 
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复习 题 

( 带 * 的 题目 涉及 选 学 章节 的 内 容 。) 状态 ,并 产生 输出 1 和 0。 如 果 在 电路 输入 端 
发 送 第 三 个 脉冲 , 将 会 产生 什么 输出 呢 ? 发 
送 第 四 个 脉冲 呢 ? 


1. 假设 上 面 输入 为 1, 下 面 输入 为 0, 请 确定 下 面 
每 一 个 电路 的 输出 值 。 如 果 上 面 输入 为 0， 下 
面 输入 为 1 呢 ? 


i 
i 


2. a. 下 面 这 个 电路 做 的 是 什么 布尔 运算 ? 


输入 
输出 
输入 


b. 下 面 这 个 电路 做 的 是 什么 布尔 运算 ? 


*3. a. 如 果 要 从 某 个 电子 元 件 商 店 购买 触发 器 电 
路 ， 我 们 会 发 现 它 有 一 个 额外 的 输入 端 ， 
称 为 反 向 器 (flip)。 当 反 向 器 的 输入 从 0 变 
成 1 时 ， 输 出 将 翻转 状态 (如 果 原 来 是 0， 
现在 就 是 1， 反 之 亦 然 )。 但 是 ， 当 反 向 器 
输入 从 1 变 为 0 时 ， 什 么 都 不 会 发 生 。 虽 然 
我 们 可 能 不 知道 这 个 电路 完成 这 一 行为 的 
细节 ， 但 我 们 仍然 可 以 将 其 用 作 其 他 电路 
的 抽象 工具 。 请 考虑 使 用 下 面 两 个 触发 器 的 
电路 。 如 果 在 电路 的 输入 端 发 送 一 个 脉冲 ， 
下 面 的 那个 触发 器 将 变换 状态 。 但 是 ， 另 一 
个 触发 器 不 会 改变 ， 因为 其 输入 (这 一 输入 
是 从 非 门 的 输出 接收 到 的 ) 从 1 变 成 了 0。 
此 , 这 一 电路 现在 的 输出 为 Oo 和 1。 在 电路 输 
入 端 发 送 第 二 个 脉冲 将 翻转 两 个 触发 器 的 





b. 计算 机 中 不 同 组 件 的 活动 一 般 是 需要 协调 
的 。 只 需 将 脉冲 信号 〈 称 为 时 钟 ) 连接 到 类 
似 a 中 的 电路 即 可 。 额 外 的 门 〈 如 图 所 示 ) 
以 协同 的 方式 发 送信 号 到 其 他 连接 的 电路 。 
研究 这 一 电路 时 ， 你 应 该 能 够 确认 这 样 一 个 
事实 ， 即 在 第 1 个 、 第 5 个 、 第 9 个 …… 时 钟 
脉冲 下 , 输出 端 A 将 发 送 1。 哪些 时 钟 脉冲 将 
使 输出 端 B 发 送 1? 哪些 时 钟 脉冲 将 使 输出 
端 C 发 送 1? 在 第 4 个 时 钟 脉冲 下 ， 哪 个 输出 
端的 输出 为 1? 








4. 假设 下 面 电 路 的 两 个 输入 都 是 1。 请 描述 如 果 
上 面 输出 暂时 变 为 0， 会 发 生 什么 。 如 果 下 面 
输入 和 暂时 变 为 0， 又 会 发 生 什么 。 用 与 非 门 重 
新 绘制 这 个 电路 。 


(Am 


. 下 面 表格 显示 的 是 (采用 十 六 进 制 记 数 法 表示 
的 ) 机 器 主 存储 器 某 些 单元 的 地 址 和 内 容 。 根 
据 这 个 存储 安排 , 按照 下 列 指令 , 记录 下 这 些 
存储 单元 的 最 后 内 容 。 


地 址 内 容 
00 AB 
01 53 
02 D6 
03 02 
步骤 1: 将 地 址 为 03 的 单元 的 内 容 移 动 到 地 址 
为 00 的 单元 中 。 
步骤 2: 将 值 01 移 动 到 地 址 为 02 的 单元 。 
步骤 3: 将 地 址 01 中 存储 的 值 移动 到 地 址 为 03 
的 单元 。 


.如果 每 个 单元 地 址 都 可 以 用 2 个 十 六 进 制 数字 


表示 ， 那 么 一 台 计 算 机 的 主 存储 器 中 可 以 有 多 
少 个 单元 ? 如 果 用 4 个 十 六 进 制 数字 呢 ? 


. 什么 位 模式 可 以 用 下 面 的 十 六 进 制 记 数 法 
表示 ? 
a.CD b. 67 c. 9A 
d. FF e. 10 

. 下 列 用 十 六 进 制 记 数 法 表示 的 位 模式 中 , 最 高 
有 效 位 的 值 是 什么 ? 
a. 8F b. FF 
c. 6F d. 1F 

. 用 十 六 进 制 记 数 法 表示 下 面 的 位 模式 。 


a. 101000001010 
b. 110001111011 
c.000010111110 


. 假设 一 个 数码 相机 的 存储 容量 是 256 MB。 如 


果 一 张 照片 每 行 每 列 都 有 1024 个 像素 , 而 且 每 
个 像素 需要 3 个 字 节 的 存储 空间 ， 那 么 这 个 数 
码 相 机 可 以 存储 多 少 张 照片 ? 


. 假设 显示 屏 上 的 一 张 图 片 是 由 一 个 768 行 x 


1024 列 的 像素 矩阵 表示 的 。 如 果 每 个 像素 的 颜 
色 需 要 用 8 位 进行 编码 , 并 且 亮度 需要 用 另外 8 
位 进行 编码 , 那么 要 保存 整 幅 图 片 需要 多 少 字 
节 的 存储 单元 ? 


. a. 指出 主 存储 器 优 于 磁盘 存储 器 的 两 个 优点 。 


b. 指出 磁盘 存储 器 优 于 主 存储 器 的 两 个 优点 。 


. 假设 个 人 计算 机 上 120 GB 的 硬盘 只 剩 下 50 GB 是 


空闲 的 ， 那 么 用 CD 备份 硬盘 上 的 资料 是 否 合 
理 ? 用 DVD 呢 ? 


. 如 果 磁 盘 的 每 一 个 扇 区 包含 1024 个 字 节 , 而 且 


每 个 字符 用 2 个 字 节 的 Unicode 字 符 表 示 , 那么 
存储 一 页 文本 (如 50 行 ， 每 行 100 个 字符 ) 需 
要 多 少 户 区 ? 


,如 果 用 ASCII 码 ， 每 页 3500 个 字符 ， 那么 存储 一 


本 400 页 的 小 说 需要 多 少 字 节 的 存储 空间 ? 如 


20. 


2 


22. 


23; 
24. 


23. 


*26. 


*27, 


28. 
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果 用 2 个 字 节 的 Unicode 字 符 又 需要 多 少 字 节 ? 


. 一 个 典型 硬盘 驱动 器 的 转速 为 每 秒 3600 转 , 那 


么 它 的 等 待 时 间 是 多 少 ? 


. 如 果 一 个 硬盘 驱动 器 的 转速 为 每 秒 360 转 ， 


寻 道 时 间 是 10 ms， 那 么 它 的 平均 存 取 时 间 
是 多 少 ? 


. 假设 一 个 打字 员 每 天 打字 24 小 时 ， 每 分 钟 打 60 


个 字 ， 那 么 这 个 打字 员 要 多 久 才能 填 满 容量 为 
640 MB 的 CD? 假定 一 个 单词 由 5 个 字符 构 
成 ， 每 个 字符 需要 1 个 字 节 的 存储 空间 。 


.下面 是 用 ASCII 编 码 的 信息 。 内 容 是 什么 ? 


01010111 
00100000 
01110011 
00100000 
00111111 
下 面 信息 使 用 ASCII 编 码 ， 每 个 字符 一 个 字 
节 ， 并 用 十 六 进 制 记 数 法 表示 出 来 。 内 容 是 
什么 ? 

686578206E6F746174696F6E 

用 ASCII 对 下 面 的 句子 编码 ， 每 个 字符 一 
个 字 节 。 

a. Does 100/5=20? 

b. The total cost is $7.25. 

将 前 面 问题 的 答案 用 十 六 进 制 记 数 法 表示 
出 来 。 

列 出 整数 8 到 18 的 二 进 制 表示 。 

a. 通过 用 ASCII 表 示 2 和 3， 写 出 数字 23。 

b. 用 二 进 制 表示 写 出 数字 23。 

什么 值 的 二 进 制 表示 只 有 一 个 位 为 1? 列 出 具 
有 这 个 特性 的 最 小 的 6 个 值 的 二 进 制 表示 。 

将 下 面 的 每 个 二 进 制 表示 转换 成 相应 的 十 进 


01101000 01100001 
01100100 01101111 
00100000 01101001 
01110011 01100001 


01110100 
01100101 
01110100 
01111001 


制 表示 。 

区 二 b. 0001 尼 寺 和 TO0L 

d. 1000 ev. 工 0011 在 000000 
g. 1001 h. 10001 i. 100001 
j. 11001 k. 11010 L14041 


将 下 面 每 个 十 进 制 表 示 转 换 成 相应 的 二 进 制 


a.7 b. 11 c. 16 

d. 17 e. 31 

将 下 面 的 每 一 个 余 16 表 示 转 换 成 相应 的 十 进 
制 表 示 。 

a. 10001 b. 10101 c. 01101 

d. 01111 e11111 
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*29. 将 下 面 的 每 一 个 十 进 制 表示 转换 成 相应 的 余 4 


表示 。 
a.0 b.3 C= 
d.—l 4 

*30. 将 下 面 的 每 个 二 进 制 补 码 表示 转换 成 相应 的 
十 进 制 表示 。 
人 从 二 二 二 b. 10100 c. 01100 
d.10000 e. 10110 

*31. 将 下 面 的 每 个 十 进 制 表示 转换 成 相应 的 二 进 
制 补 码 表示 ， 其 中 每 个 值 用 7 位 表示 。 
a,13 Dy=18 6.=l 
d.0 e.16 


*32. 假定 下 面 这 些 位 串 都 是 用 二 进 制 补 码 记 数 法 
表示 的 值 , 执行 下 面 这 些 加 法 运算 。 指 出 哪 一 
个 加 法 的 答案 是 由 于 溢出 而 不 正确 的 。 
a. 00101+01000 b.11111+00001 
c. 01111+00001 dd.10111+11010 
e.11111+11111 ， 工 00111 +01100 
解答 下 面 的 每 个 问题 : 将 这 些 值 翻译 成 二 进 制 
补 码 记 数 法 (用 5 位 模式 ), 把 减法 问题 转换 成 
相应 的 加 法 问题 ， 并 执行 那个 加 法 。 将 所 得 答 
案 转 换 成 十 进 制 记 数 法 进行 验证 。( 观 察 溢出 


33; 


现象 。) 
a St+1 b. $=1 6 2 一 3 
dd 87 €e. 12+5 不 5 一 11 
*34. 将 下 面 的 每 个 二 进 制 表示 转换 成 相应 的 十 进 
制 表 示 。 
和 b.100.0101 6.0.1101 
本 6. 10..01 
*35. 用 二 进 制 记 数 法 表示 下 面 每 个 值 。 
3 13 3 
a. 3 b. I 3 
a e 6 
*36. 用 图 1-24 中 描述 的 浮 点 格式 对 下 面 的 位 模式 


解码 。 
a. 01011001 b.11001000 
d. 00111001 

*37. 用 图 1-24 中 描述 的 8 位 浮 点 格式 对 下 面 的 值 编 
码 。 指 出 出 现 截断 误差 的 每 个 情形 。 


c.10101100 


1 1 3 
, 二 对 
i 2 TP 
as 浊 

32 32 


*38. 假定 你 不 受 使 用 标准 化 格式 的 限制 , 用 图 1-24 


3 


*40. 


*4 


*42. 


*43. 


*44. 


*45. 


*46. 


*47. 


*4 


一 


Oo 


中 描述 的 浮 点 格式 列 出 所 有 可 以 表示 值 的 
位 模式 。 

用 图 1-24 中 描述 的 8 位 浮 点 格式 ， 求 可 以 表示 
的 最 近似 于 2 的 平方 根 的 值 . 如 果 机 器 利用 这 
一 浮 点 格式 对 这 个 数 做 平方 ， 实 际 得 到 的 值 
是 什么 ? 

用 图 1-24 所 示 的 8 位 浮 点 格式 可 以 表示 的 最 近 


似 于 二 的 数值 是 什么 ? 


. 当 用 浮 点 记 数 法 记录 使 用 米 制 系统 的 度量 时 ， 


为 什么 会 产生 误差 ? 例如 ， 若 110cm 用 米 制 单 

位 记录 情况 会 怎样 ? 

位 模式 01011 和 11011 表 示 的 是 同一 个 值 , 一 个 

是 用 余 16 记 数 法 存储 的 , 另 一 个 是 用 二 进 制 补 

码 记 数 法 存储 的 。 

a. 关于 这 个 公共 的 值 可 以 确定 的 是 什么 ? 

b. 分 别 用 二 进 制 补 码 记 数 法 和 余 码 记 数 法 存 
储 同一 个 值 ， 并 且 这 两 个 系统 采用 相同 的 
位 模式 长 度 ， 那 么 表示 此 值 的 这 两 种 模式 
是 一 种 什么 关系 ? 

3 个 位 模式 10000010、01101000 和 00000010 表 

示 的 是 同一 个 值 ， 采 用 的 是 3 种 不 同 的 表示 

法 : 二 进 制 补 码 记 数 法 、 余 码 记 数 法 和 图 1-24 

所 示 的 8 位 浮 点 格式 。 但 这 3 个 位 模式 和 这 3 个 

表示 法 的 顺序 不 一 定 是 一 一 对 应 的 。 它 们 共同 

表示 的 那个 值 是 什么 ?哪个 模式 对 应 哪个 记 

数 法 ? 

在 下 面 的 值 中 , 哪 一 个 不 能 用 图 1-24 所 示 的 浮 


点 格式 精确 地 表示 出 来 ? 
1 13 
5 二 三 
a 2 b 16 全 这 
17 ES 
d. 32 e@， 16 


如 果 用 于 表示 二 进 制 整数 的 位 串 长 度 由 4 变 成 
6， 那 么 能 够 表示 的 最 大 整数 的 值 会 发 生 什么 
变化 ? 用 二 进 制 补 码 记 数 法 又 将 如 何 呢 ? 

如 果 一 个 4 MB 的 存储 器 每 个 单元 可 以 存储 1 字 
节 ， 那 么 其 最 大 地 址 的 十 六 进 制 表示 是 什么 ? 
如 果 使 用 LZW 压 缩 和 最 初 只 包含 x、y 和 一 个 空 
格 〈 如 1.8 节 所 述 ) 的 字典 ， 对 下 面 信息 编码 
XXY YYX XXYy XXY YYX 
那么 编码 结果 是 什么 ? 


.下面 信 息 是 使 用 LZW 压 缩 的 ， 其 字典 的 第 1、 


2、3 个 条 目 分 别 是 x、y 和 空格 。 这 条 信息 的 解 
压缩 结果 是 什么 ? 
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如 果 信 息 

XXY YYX XXY XXYyy 

是 用 LZW 压 缩 的 ， 并 且 最 初 字 典 的 第 !、2、3 
个 条 目 分 别 是 x、y 和 空格 , 那么 最 后 的 字典 里 
有 哪些 条 目 ? 

我 们 将 在 下 一 章 学 到 ， 通 过 传统 电话 系统 传 
输 位 的 一 种 方法 : 首先 将 位 模式 转换 成 声音 ， 
然后 通过 电话 线 传输 声音 ， 最 后 再 将 声音 转 
换 回 位 模式 。 这 种 技术 的 传输 速率 最 高 可 达 
57.6 Kbit/s。 如 果 视 频 采用 MPEG 压 缩 ， 那 么 
这 种 技术 能 否 满足 远程 会 议 的 需要 ? 


. 使 用 ASCII 对 下 面 的 句子 编码 ， 使 用 偶 校 验 ， 在 


每 个 字符 编码 的 高 位 端 添 加 一 个 奇偶 校 验 位 。 

a. Does 100/5=20? 

b. The total cost is $7.25. 

下 面 信息 的 每 一 个 短 位 串 , 最 初 都 是 用 奇 校 验 

传输 的 。 哪 一 个 位 串 绝对 出 现 了 差错 ? 

11001 11011 10110 00000 11111 

10001 10101 00100 01110 

假如 一 个 24 位 的 编码 是 这 样 产生 的 : 将 一 个 符号 的 

ASCI[ 表 示 连 续 复 甫 B 次 ， 用 得 到 的 结果 表示 该 符号 

(例如 ， 符 号 A 用 位 串 010000010100000101000001 

表示 )。 这 个 新 编码 有 哪些 纠 错 特 性 ? 

用 图 1-28 的 纠 错 码 对 下 面 的 词语 进行 解码 。 

L11010 110110 

b. 101000 100110 

c. 011101 000110 

d. 010010 001000 
000000 110111 100110 

e. 010011 000000 101001 100110 

国际 货币 汇率 变化 很 频繁 。 研 究 一 下 货币 汇 


001100 
000000 
001110 


010100 
T01111 
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率 ， 并 相应 地 更 新 1.8 节 的 货币 转换 器 脚本 。 
找 出 一 种 1.8 节 的 那个 货币 转换 器 里 没有 的 货 
币 。 得 到 它 的 当前 汇率 ， 并 在 网 络 上 找到 它 
的 Unicode 货 币 符号 。 扩 展 货币 转换 器 脚本 ， 
让 它 能 够 转换 这 个 新 货币 。 

如 果 你 的 网 络 浏 览 器 和 文本 编辑 器 能 很 好 地 支 
持 Unicode 和 UTF-8， 那 么 请 把 实际 的 国际 货币 
符号 复制 /粘贴 到 1.8 节 的 转换 器 脚本 中 ,， 替换 掉 
'\u00A3' 这 样 的 复杂 代码 。( 如 果 你 的 软件 处 
理 Unicode 有 困难 ， 那 么 当 你 尝试 这 样 做 时 ， 你 
的 文本 编辑 器 里 可 能 会 出 现 奇怪 的 符号 。) 
1.8 节 的 货币 转换 器 脚本 在 执行 每 一 个 乘法 之 
前 ， 使 用 了 一 个 变量 dollars 来 存储 要 转换 
的 金额 。 这 使 得 脚本 中 每 个 乘法 代码 行 的 长 
度 ， 比 直接 键入 整数 数量 1000 的 长 度 要 长 。 
提前 创建 这 个 额外 的 变量 有 什么 好 处 ? 
编写 并 测试 一 个 Python 脚本 ， 给 定 一 个 字 节 
数 ， 输 出 与 其 相等 的 千 字 节 数 、 兆 字 节 数 、 
吉 字 节 数 和 太 字 节 数 。 再 编写 并 测试 一 个 互 
补 脚本 ， 给 定 一 个 太 字 节 数 ， 输 出 与 其 相等 
的 GB 数 、MB 数 、KB 数 以 及 字 节 数 。 

编写 并 测试 一 个 Python 脚本 ， 给 定 一 个 录音 的 
分 秒 数 ， 计 算 对 这 个 时 长 的 未 压缩 的 CD 音量 
的 立体 声音 频数 据 进行 编码 所 需 的 位 数 。( 复 
习 1.4 节 的 必要 参数 和 公式 。) 


. 指出 下 面 Python 脚 本 中 的 错误 。 


days per week = 7 

weeks Per year = 52 

days per year = days per week ** 
weeks per year 

PRINT (days per year) 
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希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 道德 、 社 会 和 法 律 问题 。 回 答 出 这 

些 问题 还 不 够 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

1. 某 个 截断 错误 出 现在 一 个 关键 时 刻 ， 引 起 了 巨大 的 损失 和 人 身 伤亡 。 如 果 有 人 需要 对 
此 负责 ， 那 么 是 谁 ? 是 硬件 设计 者 ? 软件 设计 者 ? 编写 那 段 程 序 的 程序 员 ? 还 是 决定 
在 那个 特定 应 用 中 使 用 这 个 软件 的 人 ? 如 果 最 初 开发 这 个 软件 的 公司 已 经 修正 过 这 个 
软件 ， 但 是 用 户 没有 为 那个 关键 应 用 购买 并 应 用 这 个 升级 版 ， 又 将 如 何 ? 如 果 这 个 软 


件 是 盗版 的 呢 ? 


2. 对 于 个 人 来 讲 ， 在 开发 他 自己 的 应 用 时 忽略 截断 错误 的 可 能 性 以 及 它们 的 后 果 ， 是 可 以 
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接受 的 吗 ? 
. 20 世 纪 70 年 代 开 发 的 软件 只 用 2 个 数字 表示 年 《如 用 76 表 示 1976 年 )， 忽 视 了 这 个 软件 在 


即将 到 来 的 世纪 之 交会 有 缺陷 这 个 事实 , 这 道德 吗 ? 若 现在 只 用 3 个 数字 表示 年 (如 用 982 
表示 1982 年 ， 用 015 表 示 2015 年 ) 又 是 否 道德 呢 ? 如 果 只 用 4 个 数字 呢 ? 


. 许多 人 认为 ， 对 信息 进行 编码 经 常会 削弱 或 牌 曲 该 信息 ， 因 为 这 实质 上 迫使 信息 必须 被 


量化 。 他 们 认为 , 若 一 份 调查 问卷 要 求 调查 对 象 只 能 用 给 定 的 5 个 等 级 来 发 表 他 们 的 意见 ， 
这 份 问卷 本 身 就 是 有 缺陷 的 。 信 息 可 以 量化 到 什么 程度 ? 垃圾 处 理 场 选 址 的 利弊 可 以 量 
化 吗 ? 关于 核能 源 及 核 废料 的 辩论 是 可 量化 的 吗 ? 将 结论 建立 于 平均 值 和 其 他 统计 分 析 
上 的 做 法 危险 吗 ? 如 果 新 闻 通 讯 社 在 报导 调查 结果 时 不 使 用 问题 的 准确 措辞 ， 这 道德 
吗 ? 能 够 量化 一 个 人 的 生命 值 吗 ? 假设 一 个 公司 要 停止 对 一 个 产品 改进 的 投资 ， 尽 管 知 
道 附加 投资 可 以 减少 产品 使 用 的 危险 性 ， 这 是 可 以 接受 的 吗 ? 


. 收集 和 散发 数据 的 权利 是 否 应 该 根据 数据 形式 的 不 同 而 有 所 差别 ?也 就 是 说 ， 收 集 和 散 


发 照片 、 音 频 或 者 视频 的 权利 是 否 应 该 与 收集 和 散发 文本 的 一 样 ? 


. 无 论 是 有 意 的 还 是 无 意 的 ， 记 者 的 报道 中 通常 都 会 反映 出 记者 本 人 的 偏见 。 一 般 只 要 改 


儿 个 词语 ,一 个 故事 就 可 能 被 赋予 正面 或 负面 的 含义 。( 比较“ 大 多 数 受 访 者 都 反对 公民 
投票 。” 与 “ 受 访 者 中 有 相当 一 部 分 支持 公民 投票 。”) 修改 一 个 故事 ( 删 掉 某 些 观点 或 者 
仔细 选 词 ) 和 修改 一 张 照 片 有 区 别 吗 ? 


. 假设 数据 压缩 系统 的 使 用 会 导致 一 些微 小 但 重要 的 信息 的 丢失 。 这 会 产生 什么 样 的 责任 


问题 ? 应 该 如 何 解决 ? 
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数据 操控 


章 学 习 计算 机 如 何 操控 数据 以 及 如 何 与 外 围 设备 〈 如 打印 机 和 键盘 ) 通信 。 为 此 ， 
我 们 将 研究 计算 机 体系 结构 的 基础 知识 ， 学 习 计算 机 是 如 何 利用 称 为 机 器 语言 指令 
的 编码 指令 来 进行 编程 工作 的 。 


本 章 内 容 

2.1 计算 机 体系 结构 *2.5 与 其 他 设备 通信 
2.2 机 器 语言 *2.6 ”数据 操控 编程 
2.3 ”程序 执行 *2.7 其 他 体系 结构 


*2.4 算术 /逻辑 指令 


在 第 1 章 中 ,我 们 学 习 了 有 关 计 算 机 数据 存储 的 主题 ， 本 章 将 介绍 计算 机 如 何 操控 这 些 数 
据 。 这 里 所 说 的 操控 包括 将 数据 从 一 个 位 置 移动 到 另 一 个 位 置 ， 以 及 执行 各 种 操作 ， 如 算术 计 
算 、 文 本 编辑 和 图 像 处 理 等 。 首 先 我 们 要 了 解除 数据 存储 系统 之 外 的 计算 机 体系 结构 。 
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2.1 计算 机 体系 结构 _ 


计算 机 中 控制 数据 操控 的 电路 称 为 中 央 处 理 器 (central processing unit)， 即 CPU, 通常 简称 
为 处 理 器 。 在 20 世 纪 中 期 的 机 器 中 ，CPU 属 于 大 部 件 ， 由 阁 干 机 架 中 的 电子 线路 组 成 ， 这 也 反 
映 了 该 部 件 的 重要 性 。 不 过 ， 科 技 进步 已 经 极 大 地 缩小 了 这 些 部 件 。 现 在 ， 人 台式 计算 机 和 笔记 
本 电脑 中 的 CPU 都 是 很 小 的 正方 形 薄片 (大 约 都 只 有 2X2 英 寸 ), 它们 的 连接 引 脚 插 在 机 器 主 电 
路 板 [ 称 为 主板 (motherboard)] 的 插座 上 。 在 智能 手机 、 小 型 笔记 本 电脑 和 其 他 移动 因特网 设 
备 (Mobile Internet Device，MID) 上 ，CPU 大 约 是 邮票 的 一 半 大 小 。 由 于 它们 的 尺寸 小 ， 这 些 
处 理 器 被 称 作 微 处 理 器 (microprocessor )。 


2.1.1 CPU 基础 知识 


CPU 由 3 部 分 构成 〈 见 图 2-1): 算术 /逻辑 单元 (arithmetic/logic unit)， 它 包含 在 数据 上 执行 
运算 〈 如 加 法 和 减法 ) 的 电路 ; 控制 单元 〈control unit)， 它 包含 协调 机 器 活动 的 电路 ;寄存 器 
单元 (register unit),， 它 包含 称 为 寄存 器 (register) 的 数据 存储 单元 (与 主 存储 器 存储 单元 相似 )， 
用 作 CPU 内 部 的 信息 临时 存储 。 

寄存 器 单元 中 的 一 些 寄存 器 被 看 成 是 通用 寄存 器 (general-purpose register)， 而 其 他 一 些 则 
被 看 成 是 专用 寄存 器 (special-purpose register)， 我 们 将 在 2.3 节 讨论 一 些 专用 寄存 器 ， 现 在 我 们 
只 关注 通用 寄存 器 。 
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CPU 主 存储 器 
寄存 器 
算术 /加 辑 单 元 晶 
全 
吕 总 线 
Ee 
控制 单元 本 


寄存 器 
图 2-1 通过 总 线 连接 的 CPU 和 主 存储 器 


通用 寄存 器 用 于 临时 存储 CPU 正在 操控 的 数据 。 这 些 寄存 器 存储 算术 /逻辑 单元 电路 的 输入 
值 以 及 该 部 件 所 产生 的 结果 。 为 了 操作 存储 在 主 存储 器 中 的 数据 ， 控 制 单元 要 把 存储 器 里 的 数 
据 传送 到 通用 寄存 器 , 通知 算术 /逻辑 单元 哪些 寄存 器 保存 了 这 一 数据 ,激活 算术 /逻辑 单元 中 的 
有 关 电 路 ， 并 告知 算术 /逻辑 单元 哪个 寄存 器 将 接收 结果 。 

为 了 传输 位 模式 ， 机 器 CPU 和 主 存储 器 通过 一 组 称 为 总 线 (bus， 再 见 图 2-1) 的 线路 进行 
连接 。 利 用 总 线 ，CPU 给 出 相关 存储 单元 的 地 址 以 及 相应 的 电信 号 〈 告 知 存储 器 电路 ， 将 在 指 
定单 元 中 获取 数据 )， 从 主 存储 器 中 取出 〈 读 ) 数据 。 同 理 ，CPU 可 以 向 主 存储 器 中 放 入 〈 写 入 ) 
数据 ， 方 法 是 提供 目的 单元 地 址 和 一 起 写 入 的 数据 以 及 适当 的 电信 号 (告知 主 存储 器 ， 将 要 存 
储 发 送 给 它 的 数据 )。 

基于 此 设计 ， 将 存储 在 主 存储 器 中 的 两 个 值 相 加 的 任务 不 仅仅 涉及 执行 加 法 运算 。 数 据 必 
须 先 从 主 存储 器 传输 到 CPU 的 寄存 器 中 ， 值 相 加 后 ， 先 把 结果 放 在 寄存 器 中 ， 然 后 再 把 结果 存 
储 到 主 存储 器 存储 单元 中 。 整 个 过 程 被 总 结 成 如 图 2-2 所 示 的 5 个 步骤 。 


从 存储 器 中 取出 一 个 要 加 的 值 放 入 一 个 寄存 器 中 。 
从 存储 器 中 取出 另 一 个 要 加 的 值 放 入 另 一 个 寄存 器 中 。 
激活 加 法 电路 ， 以 步骤 1 和 2 所 用 的 寄存 器 作为 输入 ， 用 另 一 个 寄存 器 存放 相 加 的 结果 。 


将 结果 存 入 存储 器 。 
停止 。 





图 2-2 主 存 储 器 中 的 值 相 加 
2.1.2 存储 程序 概念 


早期 计算 机 不 是 很 灵活 ， 每 个 设备 所 执行 的 步骤 都 被 内 置 于 控制 单元 中 ， 作 为 计算 机 的 一 
部 分 。 为 了 增加 其 灵活 性 ， 一 些 早期 电子 计算 机 的 设计 使 得 CPU 可 以 方便 地 重新 布线 。 其 灵活 
性 通过 插 拔 装 置 体现 ， 类 似 于 老式 的 电话 交换 台 上 把 跳 线 的 端子 插 到 接线 孔 中 。 

认识 到 一 个 程序 可 以 像 数 据 一 样 进行 编码 并 存储 在 主 存 储 嚣 中， 这 是 一 个 突破 性 进展 (但 
是 将 其 归功 于 约翰 。 汉 “。 诺 依 曼 显然 是 不 正确 的 )。 如 果 控 制 单元 可 以 从 存储 器 中 读 取 程 序 、 将 
指令 解码 并 执行 它们 ， 那 么 机 器 要 遵照 执行 的 程序 就 可 以 被 修改 ， 这 只 需要 改变 计算 机 存储 器 
中 的 内 容 而 不 必 对 CPU 进行 重新 布线 。 


2.2 机 器 # 
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将 计算 机 存储 设备 与 其 对 应 功能 进行 比较 是 很 有 启发 性 的 。 寄 存 器 用 于 存储 可 立即 进行 
运算 的 数据 ， 主 存储 器 用 于 存储 即将 使 用 的 数据 ， 海 量 存储 器 用 于 存储 最 近 也 许 不 会 使 用 的 
据 。 许 多 计算 机 设计 都 增加 了 一 个 附加 的 存储 器 层次 ， 称 为 高 速 缓冲 存储 器 。 高 速 缓冲 存 
储 器 (cache memory ) 是 位 于 CPU 内 部 的 高 速 存储 器 的 一 部 分 (也 许 有 几 百 KB )。 在 这 个 特 
丈 的 存储 区 域 中 ， 机 器 试图 保存 主 存储 器 中 当前 最 重要 的 那 部 分 内 容 的 一 个 副本 。 这 样 ， 通 
常 要 在 寄存 器 与 主 存储 器 之 间 进 行 的 数据 传输 将 变 成 寄存 器 与 高 速 缓冲 存储 器 之 间 的 数据 传 
输 。 因 此 ， 高速 缓 冲 存 储 器 中 的 任何 改变 都 会 在 恰当 时 间 被 一 起 传输 给 主 存储 器 . 于 是 , CPU 
可 以 较 快 地 执行 它 的 机 器 周期 ， 因 为 它 不 会 被 与 主 存储 器 的 通信 所 延迟 。 





将 某 项 发 明 的 荣誉 授予 个 人 总 是 备 受 争议 。 人们 将 白炽 灯 的 发 明 归 功 于 托马斯 。 爱 迪生 
(Thomas Edison )， 但 是 其 他 研究 员 也 曾 研制 了 类 似 的 灯泡 ， 从 某 种 意义 上 说 ， 爱 迪生 只 是 比 
较 幸 运 地 获得 了 专利 。 人 们 认为 是 菜 特 ( Wright ) 兄弟 发 明 的 飞机 ， 但 他 们 曾 与 其 他 人 竞争 
并 受益 于 其 他 人 的 研究 ， 在 某 种 程度 上 ， 他 们 又 被 列 奥 纳 多 : 达 . 芬 奇 (Leonardo da Vinci ) 
抢先 了 ， 他 早 在 15 世 纪 就 有 了 玩 玩 飞 行 机 器 的 想法 。 其 至 达 芬 奇 的 设计 看 起 来 也 是 假借 前 人 
的 思想 。 当 然 ， 对 于 这 些 发 明 ， 被 认定 的 发 明 人 还 是 有 权 拥 有 被 授予 的 荣誉 的 。 但 对 于 其 他 
一 些 情况 ， 历 史上 的 有 些 荣 誉 授予 似乎 是 不 恰当 的 ， 如 存储 程序 的 概念 。 毫 无 疑问 ， 的 
翰 ， 冯 。 诺 依 曼 ( John von Neumann ) 是 一 位 卓越 的 科学 家 ， 理 应 为 自己 的 许多 贡献 获得 荣 
誉 。 但 是 ， 历 史 选 择 授予 他 荣誉 的 贡献 是 存储 程序 概念 ， 但 这 一 思想 很 显然 是 由 宾夕法尼亚 
大 学 莫 尔 电子 工程 学 席 以 埃 克 特 (TP Eckert) 为 首 的 研究 人 员 提出 的 、 约翰 。 冯 “。 诺 依 曼 不 
过 是 第 一 个 在 著作 中 转述 这 一 思想 的 人 ， 因 此 计算 机 办 选择 他 作为 发 明 人 。 


将 计算 机 程序 存储 在 主 存储 器 中 的 思想 称 为 存储 程序 i hai ei me 它 已 
经 成 为 今天 所 使 用 的 标准 方法 一 一 实际 上 它 的 标准 性 很 显然 。 最 初 的 困难 源 于 人 们 将 程序 和 数 
据 视 为 不 同 的 实体 : 数据 存储 在 存储 器 中 ， 而 程序 为 CPU 的 一 部 分 。 于 是 就 成 了 “只 见 树木 ， 
不 见 森林 ”的 一 个 极 好 实例 。 人 们 很 容易 被 老 一 套 所 束缚 ， 如 果 今 天 仍 不 了 解 这 一 点 ， 那 么 计 
算 机 科学 的 发 展 也 许 还 会 庄 足 不 前 。 的 确 ， 科 学 中 令 人 兴奋 的 部 分 是 ， 新 的 思想 不 断 为 新 的 理 
论 和 新 的 应 用 开启 大 门 。 


问题 与 练习 


1. 将 计算 机 中 一 个 存储 单元 的 内 容 移 到 另 一 个 存储 单元 ， 你 认为 需要 哪些 事件 序列 ? 
2. 要 想 将 一 个 值 写 入 存储 单元 中 ，CPU 必 须 给 主 存储 器 电路 提供 什么 信息 ? 
3. 海量 存储 器 、 主 存储 器 以 及 通用 寄存 器 都 是 存储 系统 。 它 们 在 用 法 上 有 什么 不 同 ? 


二 机 器 语 言 


为 了 应 用 存储 程序 概念 ，CPU 被 设计 成 可 以 识别 位 模式 编码 的 指令 。 这 组 指令 以 及 编码 系 
统统 称 为 机 器 语言 (machine language)。 使 用 此 语言 表达 的 指令 称 为 机 器 级 指令 ， 更 多 人 称 其 
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为 机 器 指令 (machine instruction ) 。 
2.2.1 指令 系统 


一 个 典型 CPU 必须 能 够 解码 及 执行 的 机 器 指令 列表 非常 短 。 实 际 上 ， 一 旦 机 器 能 够 实现 某 
些 基 本 而 精 选 的 任务 ， 那 么 添加 再 多 的 特性 也 不 会 增加 该 机 器 理论 上 的 能 力 。 换 名 话说 ， 超 过 
某 个 特定 点 之 后 ， 附 加 的 特性 也 许 能 够 增加 一 些 好 处 ， 如 便利 性 ， 但 是 机 器 的 基本 能 力 不 会 有 
任何 改变 。 

在 设计 机 器 时 ， 根 据 该 事实 被 利用 的 程度 的 不 同 ， 产 生 了 两 种 CPU 体系 结构 哲学 。 一 种 是 
CPU 只 需要 执行 最 小 的 机 器 指令 集 ， 在 这 种 思想 的 作用 下 ， 产 生 了 精简 指令 集 计算 机 (reduced 
instruction set computer，RISC)。RISC 体 系 结构 的 支持 者 认为 ， 这 种 计算 机 效率 高 、 速 度 快 ， 制 
造成 本 较 低 。 男 一 方面 ， 男 外 一 些 人 则 认为 CPU 应 能 够 执行 大 量 复 杂 的 指令 ， 尽 管 其 中 许多 在 
技术 上 是 多 余 的 ， 在 这 种 思想 的 作用 下 ， 产 生 了 复杂 指令 集 计 算 机 (complex instruction set 
computer，CISC)。CISC 的 支持 者 认为 ，CPU 越 复杂 越 容易 应 对 现代 软件 日 益 增加 的 复杂 性 。 
通过 CISC, 程序 可 以 利用 一 个 强大 的 丰富 指令 集 ， 其 中 很 多 指令 都 需要 RISC 设 计 中 的 一 个 多 指 
令 序 列 。 

20 世 纪 90 年 代 至 21 世 纪 , 市 场 上 在 售 的 CISC 处 理 器 和 RISC 处 理 器 都 在 积极 地 争 抢 桌 面 计算 
的 霸主 地 位 。 用 于 个 人 计算 机 中 的 英特尔 处 理 器 是 CISC 体 系 结构 的 代表 , 而 PowerPC 处 理 器 (由 
苹果 、IBM 和 摩托 罗拉 公司 联合 开发 ) 是 RISC 体 系 结构 的 代表 ， 被 用 于 苹果 Macintosh 中 。 随 着 
时 间 的 推移 ，CISC 的 制造 成 本 大 大 降低 了 ， 因 此 英特尔 的 处 理 器 (或 AMD 公 司 的 处 理 器 ) 现在 
已 经 几乎 遍及 台式 计算 机 和 笔记 本 电脑 〈 现 在 连 苹果 公司 生产 的 计算 机 都 开始 使 用 英特尔 公司 
的 产品 了 )。 

虽然 CISC 在 台式 计算 机 领域 站 稳 了 脚跟 ， 但 其 电功率 非常 大 。 与 此 相反 ，Advanced RISC 
Machine (ARM) 公司 专门 针对 低 电 耗 设 计 了 一 种 RISC 体 系 结构 。(Advanced RISC Machine 的 
前 身 是 Acorn Computers， 现 在 是 ARM Holdings。) 因此 ， 在 游戏 控制 器 、 数 字 电 视 、 导 航 系 统 、 
汽车 部 件 、 移 动 电话 、 智 能 手机 和 其 他 消费 性 电子 产品 中 ， 很 容易 找到 由 高 通 《Qualcomm ) 和 
德州 仪器 〈Texas Instruments) 等 多 个 供应 商 制造 的 基于 ARM 的 处 理 器 。 

不 管 是 选择 RISC 还 是 选择 CISC， 机 器 指令 都 可 以 分 为 3 类 : 〈1) 数据 传输 类 ; (2) 算术 / 风 
辑 类 ; (3) 控制 类 。 

1. 数据 传输 类 

数据 传输 类 指令 包含 将 数据 从 一 个 位 置 移 动 到 另 一 个 位 置 的 请 求 指令 ， 图 2-2 中 的 步骤 1、2 
和 4 都 属于 这 一 类 。 我 们 应 该 注意 到 ， 使 用 诸如 传输 (transfer) 或 移动 (move) 之 类 的 术语 来 
标识 这 类 指令 实际 上 是 用 词 不 当 。 因 为 传输 的 数据 很 少 被 从 原始 位 置 擦 除 。 执 行 传输 指令 的 过 
程 更 像 是 复制 数据 而 不 是 移动 数据 ， 因 此 ， 使 用 诸如 复制 (copy) 或 克隆 (clone) 之 类 的 术语 
能 更 好 地 描述 这 类 指令 的 活动 。 

关于 术语 ， 我 们 应 注意 到 ， 提 到 CPU 与 主 存 储 器 之 间 的 数据 的 传输 时 ， 有 专门 的 术语 。 用 存储 
单元 的 内 容 填充 通用 寄存 器 的 请 求 通常 称 为 加 载 (LOAD) 指令 ; 相反 ， 将 寄存 器 中 内 容 传 输 给 存 
储 单元 的 请 求 称 为 存储 (STORE ) 指令 。 在 图 2-2 中 ， 步 骤 1 和 2 是 LOAD 指 令 ， 步 又 4 是 STORE 指令 。 

在 数据 传输 类 中 ， 有 一 组 与 CPU- 主 存储 器 环境 之 外 的 设备 〈 打 印 机 、 键 盘 、 显 示 屏 、 磁 盘 
驱动 器 等 ) 进行 通信 的 重要 指令 。 这 些 指令 负责 处 理 机 器 的 输入 /输出 (LO) 活动 ， 因 此 被 称 
为 IO 指令 (1/O instruction)， 有 时 因为 其 特别 会 被 单独 归 为 一 类 。 另 一 方面 ，2.5 节 将 描述 如 何 
利用 一 些 相同 的 指令 来 处 理 这 些 IO 活 动 ， 这 些 指令 是 请 求 在 CPU 及 主 存储 器 之 间 传 输 数 据 的 。 
因此 ， 我 们 应 考虑 将 UO 指 令 归 入 数据 传输 类 。 
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2. 算术 /逻辑 类 

算术 /逻辑 类 指令 告诉 控制 单元 请 求 在 算术 /逻辑 单元 内 实现 一 个 活动 。 图 2-2 中 的 步骤 3 属于 
这 一 类 。 正 如 其 名 称 所 示 ， 算 术 / 罗 辑 单元 还 能 够 执行 基本 算术 运算 之 外 的 运算 。 在 这 些 附 加 的 
运算 中 ， 有 第 1 章 中 介绍 的 布尔 运算 与 、 或 和 异 或 ， 本 章 后 面 会 进一步 讲解 。 

大 多 数 算术 /逻辑 单元 中 都 还 有 另外 一 组 运算 能 让 寄存 器 中 的 内 容 在 寄存 器 中 左右 移动 。 这 
些 运算 称 为 移 位 (SHIFT) 运算 或 循环 移 位 (ROTATE ) 运算 ， 前 者 丢弃 一 端 “ 移 出 的 位 *”， 而 
后 者 将 它们 放 到 另 一 端 留 出 的 空位 上 。 

3. 控制 类 

控制 类 指令 包含 指导 程序 执行 而 非 数 据 操作 的 指令 。 图 2-2 中 的 步骤 $ 属 于 此 类 ， 但 它 是 一 
个 很 初级 的 例子 。 这 一 类 指令 包括 机 器 指令 系统 中 许多 比较 有 趣 的 指令 ， 如 转移 JUMP ) 或 分 
支 (BRANCH) 系列 指令 用 于 指示 CPU 执行 列表 中 下 一 条 指令 以 外 的 其 他 指令 。 转 移 指令 分 两 
种 ， 无 条 件 转移 unconditional jamp) 和 条 件 转移 〈conditional jump )。 前 者 的 一 个 例子 是 指令 
“ 跳 转 到 步骤 $”， 后 者 的 一 个 例子 是 指令 “如 果 所 得 数值 为 0， 跳 转 到 步骤 3?”。 两 者 的 区 别 是 ， 
只 有 满足 某 个 条 件 时 ， 条 件 转移 才 会 引起 “地 点 改变 ”。 举 例 说 明 ， 图 2-3 中 的 指令 序列 是 表示 
两 个 数值 相 除 的 算法 ， 其 中 步骤 3 是 条 件 转移 ， 用 以 防止 除数 为 0。 


把 存储 器 中 的 一 个 值 加 载 到 一 个 寄存 器 中 。 
把 存储 器 中 的 另 一 个 值 加 载 到 另 一 个 寄存 器 。 
如 果 第 二 个 值 为 0， 那 么 转移 到 步骤 6。 


用 第 一 个 寄存 器 中 的 值 除 以 第 二 个 寄存 器 中 的 值 ， 结 果 留 在 第 三 个 寄存 器 中 。 
把 第 三 个 寄存 器 的 值 存储 到 存储 器 中 。 


ER 





图 2-3 “存储 器 中 数值 的 除法 运算 
2.2.2 一 种 演示 用 的 机 器 语言 


现在 让 我 们 来 看 一 下 典型 计算 机 的 指令 是 如 何 编码 的 。 附 录 C 中 描述 了 我 们 要 讨论 的 机 器 ， 
其 体系 结构 见 图 2-4。 它 有 16 个 通用 寄存 器 , 256 个 主 存储 器 存储 单元 , 每 个 存储 单元 容量 为 8 位 。 
为 了 便于 参考 ， 我 们 将 寄存 器 标号 为 数值 0 一 15， 把 存储 单元 的 地 址 编 为 数值 0 一 255。 方 便 起 见 ， 
我 们 将 这 些 标 号 及 地 址 看 作 以 二 进 制 表示 的 数值 ， 并 使 用 十 六 进 制 记 数 法 压缩 它们 的 位 模式 。 
于 是 ， 寄 存 器 标号 为 0 一 FE， 存 储 单元 的 地 址 为 00 一 FF。 














CPU 主 存储 器 
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CF 这 


图 2-4 ”附录 C 描 述 的 机 器 的 体系 结构 


机 器 指令 编码 形式 包括 两 部 分 : 操作 码 (operation code， 简 写 为 op-code) 字段 和 操作 数 
Coperand ) 字段 。 操 作 码 字段 中 的 位 模式 指明 该 指令 要 求 的 是 什么 基本 运算 , 如 STORE、SHIFT、 
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XOR 和 JUMP 等 。 操 作 数 字段 中 的 位 模式 提供 操作 码 指定 运算 的 更 详细 信息 。 以 STORE 操 作为 例 ， 
其 操作 数字 段 中 的 信息 指示 哪个 寄存 器 包含 将 被 存储 的 数据 ， 哪 个 存储 单元 用 于 接收 该 数据 。 

我 们 演示 用 的 机 器 〈 见 附录 C) 的 整个 机 器 语言 上 只 包含 12 条 基本 指令 。 每 条 指令 都 用 16 位 编 
码 ， 由 4 个 十 六 进 制 数字 表示 〔 见 图 2-5)。 每 条 指令 的 操作 人 码 由 前 4 位 组 成 ， 等 价 于 第 一 个 十 六 进 
制 数字 。 注 意 《〈 见 附录 C)， 这 些 操 作 码 是 用 十 六 进 制 数字 1 一 C 表 示 的 。 特 别 是 ， 附 录 C 中 的 表 说 
明 以 十 六 进 制 数字 3 起 始 的 指令 表示 STORE 指令 ， 以 十 六 进 制 A 起 始 的 指令 表示 ROTATE 指 令 。 


操作 码 操作 数 
0011 0310D 140120 ‘6111 实际 的 位 模式 (16 位 ) 


3 5 A 7 十 六 进 制 形 式 (4 个 数字 ) 
图 2-5 ”附录 C 中 描述 的 机 器 的 指令 的 组 成 





渐 中 流 受 刘 的 才 各 。 来 章宗 讽 所 几 和 ( 在 附录 C 中 有 描述 ) 站 
使 用 了 固定 的 大 小 (2 个 字 节 )。 因 此 ， 为 取得 一 个 指令 ， CPU 总 是 需要 检索 2 个 连续 存储 单元 
的 内 容 ， 然 后 给 其 程序 计数 器 加 2。 这 种 一 致 性 简化 了 取 指 令 的 任务 ， 是 RISC 机 器 的 特性 。 
不 过 ，CISC 机 器 的 机 器 语言 的 指令 长 度 是 可 变 的 。 例如， 现在 的 英特尔 处 理 器 的 指令 长 度 有 
长 有 短 , 短 的 只 有 1 字 节 ， 长 的 有 多 个 字 节 ， 有 具体 取决 于 该 指令 的 确切 应 用 。 使 用 这 种 机 器 语 
言 的 CPU 根 据 指令 操作 码 来 确定 所 引入 的 指令 的 长 度 。 也 就 是 说 ，CPU 首 先 取 指 令 的 操作 码 ， 
然后 基于 收 到 的 位 模式 得 知 ， 要 得 到 余下 的 指令 还 需要 从 存储 器 中 取 多 少 字 节 。 


在 我 们 演示 用 的 机 器 中 ， 每 条 指令 的 操作 数字 段 由 3 个 十 六 进 制 数字 (12 位 ) 组 成 ， 在 每 种 
情况 下 对 操作 码 给 定 的 通用 指令 做 了 进一步 澄清 CHALT 指 令 除 外 ， 因 为 它 不 需要 进一步 的 规 
定 )。 例 如 ， 如 果 一 条 指令 的 第 一 个 十 六 进 制 数字 为 3 (存储 寄存 器 中 内 容 的 操作 码 )， 那 么 该 指 
令 的 下 一 个 十 六 进 制 数 字 会 指出 哪个 寄存 器 中 的 内 容 需要 存储 ， 最 后 的 两 个 十 六 进 制 数字 会 指 
出 由 哪个 存储 单元 接收 该 数据 ( 见 图 2-6)。 因 此 ， 指 令 35A7 十 六 进 制 ) 翻译 过 来 就 是 “将 寄 
存 器 5 中 的 位 模式 存储 “STORE)〉 到 地 址 为 A7 的 存储 单元 中 ”。( 注 意 十 六 进 制 记 数 法 的 使 用 是 
如 何 简化 我 们 的 讨论 的 。 事 实 上 ， 指 令 35A7 是 指 位 模式 0011010110100111。) 


交 $-| 加 国 顺和 


一 个 
tt 操作 数 的 这 部 分 标识 接收 
一 个 存储 单元 中 数据 的 存储 单元 的 地 址 


操作 数 的 这 部 分 标识 哪 
个 寄存 器 的 内 容 需 要 存储 


图 2-6 ”指令 35A7 的 译 码 
通过 指令 35A7 这 个 例子 ， 还 能 清楚 地 解释 为 什么 主 存储 器 容量 是 以 2 的 寡 为 度量 单位 的 。 
因为 该 指令 保留 了 8 位 用 于 指定 该 指令 所 用 的 存储 单元 , 所 以 能 够 准确 地 引用 2 个 不 同 的 存储 单 
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元 。 因 此 我 们 理所当然 要 用 这 么 多 存储 单元 (地 址 从 0 一 255) 构建 1 个 主 存储 器 。 如 果 主 存储 器 
有 更 多 的 存储 单元 ， 我 们 就 写 不 出 能 区 分 它们 的 指令 了 ; 如 果 主 存储 器 的 存储 单元 比较 少 ， 我 
们 写 出 的 指令 可 能 就 会 引用 不 存在 的 存储 单元 。 

为 了 说 明 操 作 数字 段 是 如 何 澄清 操作 码 给 定 的 通用 指令 的 , 下面 再 举 一 个 例子 。 我 们 来 
考虑 一 个 操作 码 为 7〈 十 六 进 制 ) 的 指令 ， 它 请 求 将 两 个 寄存 器 的 内 容 进行 OR (或 ) 运算 。( 在 
2.4 节 中 ， 我 们 会 看 到 两 个 寄存 器 的 “或 ”运算 意味 着 什么 。 现 在 我 们 感 兴趣 的 只 是 指令 是 如 何 
编码 的 。) 在 这 种 情况 下 ， 下 一 个 十 六 进 制 数字 指示 的 是 运算 结果 应 该 存储 在 哪 一 个 寄存 器 中 ， 
而 操作 数 的 最 后 两 个 十 六 进 制 数字 指示 的 是 要 对 哪 两 个 寄存 器 进行 “或 ?运算 。 因 此 。 指 令 70C5 
翻译 过 来 就 是 “对 寄存 器 C 和 寄存 器 5 的 内 容 进行 “或 ” 运算 ， 并 将 结果 存 入 寄存 器 0 中 ” 

我 们 所 讲 的 这 两 条 机 器 的 LOAD 指 令 存 在 细微 的 差别 。 这 里 ， 操 作 码 1〈 十 六 进 制 ) 表示 的 
指令 是 将 某 一 存储 单元 的 内 容 载 入 寄存 器 ， 操 作 码 2 十 六 进 制 ) 表示 的 指令 是 把 一 个 特定 的 值 
加 载 到 寄存 器 。 它 们 的 差别 在 于 ， 第 一 种 类 型 的 指令 的 操作 数字 段 包含 的 是 1 个 地 址 ， 而 第 二 种 
类 型 的 指令 的 操作 数字 段 包含 的 是 一 个 要 载 入 的 实际 位 模式 。 

注意 ， 该 机 器 有 两 条 ADD (加 法 ) 指令 ， 一 条 用 于 二 进 制 补 码 记 数 法 表示 的 数值 相 加 ， 一 
条 用 于 浮 点 记 数 法 表示 的 数值 相 加 。 把 它们 区 分 开 来 的 原因 是 ， 这 两 种 加 法 在 算术 /好 辑 单 元 内 
部 有 不 同 的 实现 步 又。 我 们 用 图 2-7 结 束 本 节 ， 图 2-7 中 显示 的 是 图 2-2 中 指令 的 编码 版 本 。 我 们 已 
经 假定 ， 两 个 相 加 的 数值 以 二 进 制 补 码 记 数 法 的 形式 存储 在 存储 地 址 6C 和 6D 中 ， 其 相 加 的 结果 存 
放 在 地 址 为 6E 的 存储 单元 里 。 











编码 的 指令 翻 译 

156C 把 地 址 为 6C 的 存储 单元 里 的 位 模式 加 载 到 寄存 器 5 

166D 把 地 址 为 6D 的 存储 单元 里 的 位 模式 加 载 到 寄存 器 6 

5056 把 寄存 器 3 和 6 的 内 容 按 二 进 制 补 码 表示 相 加 ， 结 果 存 入 寄存 器 0 
306E 把 寄存 器 0 的 内 容 存储 到 地 址 为 6E 的 存储 单元 中 

C000 停止 








图 2-7 ”图 2-2 中 指令 的 编码 版 本 


问题 与 练习 


. 为 什么 使 用 术语 移动 (move) 来 描述 “将 数据 从 机 器 的 一 个 位 置 移动 到 另 一 个 位 置 的 操作 ”有 可 能 不 恰当 ? 
在 本 书 中 ，JUMP 指 令 是 通过 在 指令 中 给 出 目的 地 名 称 〈 或 步骤 号 ) 的 方式 来 表示 的 〈 如 “转移 到 步 
了 骤 6”)。 这 种 技术 的 缺点 是 ， 如 果 一 个 指令 名 称 〈 或 步骤 号 ) 后 来 改变 了 ， 那 么 必须 找到 所 有 转移 到 
该 指令 的 JUMP 指 令 ， 并 改变 这 些 JUMP 指 令 中 的 目的 地 。 请 另外 设计 一 种 表达 JUMP 指 令 的 方式 ， 使 
得 不 需要 明确 给 出 目的 地 的 名 字 。 
. 指令 “如 果 0 等 于 0， 那 么 就 转移 到 步骤 7” 是 条 件 转移 还 是 无 条 件 转移 ? 请 解释 你 的 答案 。 
. 用 实际 的 位 模式 编写 图 2-7 中 的 示例 程序 。 
. 下 列 指令 是 用 附录 C 描 述 的 机 器 语言 编写 的 。 请 用 自然 语言 解释 这 些 指令 。 

a. 368A b. BADE c. 803C d. 40F4 
. 在 附录 C 描 述 的 机 器 语言 里 ， 指 令 15AB 和 25AB 有 什么 区 别 ? 
. 下 面 是 用 自然 语言 描述 的 一 些 指令 。 请 把 它们 翻译 成 附录 C 中 描述 的 机 器 语言 。 

a 将 十 六 进 制 数值 56 加 载 (LOAD) 到 3 号 寄存 器 中 。 | 

b. 将 5 号 寄存 器 循环 (ROTATE) 右 移 3 位 。 

c; 将 寄存 器 A 中 的 内 容 加 (AND) 到 寄存 器 5 中 的 内 容 上 ， 并 将 其 结果 存 入 寄存 器 0 中 。 


Il 一 


hi 上 户 


-AD 
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2.3 ”程序 执行 


计算 机 总 是 按照 需要 把 存储 器 里 的 指令 复制 到 CPU 中 来 执行 存储 器 中 的 程序 。 每 个 指令 一 
旦 到 达 CPU， 就 会 被 解码 并 执行 。 从 存储 器 中 取 指 令 的 顺序 与 这 些 指 令 存储 在 存储 器 中 的 顺序 
相对 应 ， 除 非 被 JUMP 指 令 更 改 。 

为 了 理解 整个 执行 过 程 是 如 何 进行 的 ， 我 们 有 必要 仔细 了 人 解 一 下 CPU 内 部 的 2 个 专用 寄存 
器 : 指令 寄存 器 (instruction register) 和 程序 计数 器 (program counter) (再 见 图 2-4)。 指 令 寄存 
器 用 于 存储 正在 执行 的 指令 。 程 序 计 数 器 中 包含 的 是 下 一 个 待 执 行 的 指令 的 地 址 ， 因 此 它 用 于 
以 机 器 方式 跟踪 程序 执行 到 了 什么 地 方 。 

CPU 通 过 不 断 重复 执行 一 个 算法 来 完成 它 的 工作 , 该 算法 引导 它 完成 一 个 称 为 机 器 周期 
(machine cycle) 的 三 步 处 理 。 该 机 器 周期 的 3 个 步骤 分 别 为 取 指 、 译 码 和 执行 〈 见 图 2-8 )。 
在 取 指 步骤 ，CPU 请 求 主 存储 器 给 它 提供 程序 计数 器 指定 的 地 址 中 存储 的 指令 。 因 为 我 们 机 
器 的 每 一 条 指令 的 长 度 为 2 个 字 节 ， 所 以 取 指 过 程 需 要 从 主 存储 器 中 读 取 2 个 存储 单元 的 内 
容 。CPU 将 从 存储 器 中 读 取 的 指令 存放 在 它 的 指令 寄存 器 中 ， 然 后 将 程序 计数 器 的 值 加 2， 
使 得 程序 计数 器 包含 存储 器 中 存储 的 下 一 条 指令 的 地 址 。 这 时 , 程序 计数 器 为 下 一 次 取 指 做 
好 了 准备 。 










2。 对 指令 寄存 器 中 的 位 
术 进 行 译 三 

1. 根据 程序 计数 器 规定 的 地 址 模式 进行 译 码 
从 存储 器 中 取 下 一 条 指令 ， 
然后 增加 程序 计数 器 的 值 


3. 实现 指令 寄存 器 里 
指令 所 规定 的 动作 


图 2-8 ”机 器 周期 





“购买 个 人 计算 机 时 ， 通 常用 时 名 速度 地 较 计 算 机 - 计算 机 的 时 钟 (clock ) 是 一 个 称 为 
荡 曙 器 的 电路 ， 能 生成 用 于 协调 机 器 活动 的 脉冲 一 这 个 振荡 器 电路 生成 脉冲 的 速度 越 快 ， 
机 器 执行 其 机 器 周期 的 速度 就 越 快 。 时 钟 速度 以 赫 褒 (hertz， 简 写 为 Hz ) 为 单位 ，1Hz 相 当 
。 TN 中 周 其 (或 脉冲 )。 台式 计算 机 的 典型 时 钟 周 期 是 几 百 MHz ( 较 老 的 型 号 ) 到 几 GHz。 
.megahertz 的 缩写 ，1 MHz=105Hz，GHz 是 gigahertz 的 简写 ，1 GHz=1000 MHz. ) 
Bei 让 站 未 册 作 岂 淹 亚 生 政 的 St 斑 症 环 网 地。 因此 ， 在 比较 具有 不 
单单 比较 时 钟 速度 没有 太 大 的 意义 。 如 果 你 在 比较 的 两 台 机 器 ， 一 台 基于 英 特 
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尔 处 理 器 ， 一 台 基于 ARM 处 理 器 ， 那 么 通过 基准 测试 (benchmark ) 来 比较 它们 的 性 能 则 更 有 意 
义 。 基 准 测试 是 指 ， 在 比较 不 同 机 器 时 ， 让 它们 执行 同样 的 程序 ( 称 为 基准 )， 然 后 比较 它们 的 
性 能 。 通 过 选择 代表 不 同类 型 应 用 的 基准 ， 就 能 够 得 到 对 各 类 市 场 细 分 有 意义 的 比较 结果 。 


由 于 指令 现在 已 经 存 入 了 指令 寄存 器 ，CPU 对 该 指令 译 码 ， 其 中 包括 根据 该 指令 的 操作 码 
将 操作 数字 段 分 解 为 适当 的 部 分 。 

然后 ，CPU 激 活 相 应 电路 以 执行 指令 ， 完 成 所 请 求 的 任务 。 例 如 ， 如 果 该 指令 是 从 存储 器 
中 加 载 的 ， 那 么 CPU 将 给 主 存储 器 发 送 相应 信号 ， 等 竺 主 存储 器 发 送 数据 ， 再 将 数据 存 入 要 求 
的 寄存 器 ;如 果 该 指令 是 算术 和 运算， 那么 CPU 将 用 正确 的 寄存 器 作为 输入 ， 激 活 算 术 / 届 辑 单元 
中 相应 的 电路 ， 计 算 结 果 并 将 结果 存 入 相应 的 寄存 器 。 

一 旦 指令 寄存 器 中 的 指令 执行 完毕 ，CPU 又 将 从 取 指 步骤 开始 下 一 个 机 器 周期 。 观 察 可 知 ， 由 
于 程序 计数 器 在 前 一 个 取 指 步骤 的 最 后 已 经 增加 了 值 ， 所 以 它 再 次 为 CPU 提供 了 正确 的 指令 地 址 。 

JUMP 指 令 的 执行 比较 特殊 。 例 如 ， 指 令 B258 ( 见 图 2-9) 的 含义 是 “如 果 寄 存 器 2 的 内 容 与 
寄存 器 0 的 内 容 相同 ， 则 转移 到 地 址 为 58 (十 六 进 制 》 的 指令 ”。 在 这 种 情况 下 ， 该 机 器 周期 的 
执行 步骤 首先 是 比较 寄存 器 2 和 寄存 器 0。 如 果 它 们 包括 不 同 的 位 模式 ， 那 么 执行 步骤 结束 ， 开 
始 下 一 个 机 器 周期 。 不 过 ， 如 果 这 两 个 寄存 器 的 内 容 相 同 ， 那 么 机 器 要 在 执行 步骤 中 将 数值 58 
(十 六 进 制 ) 存 入 它 的 程序 计数 器 里 。 然 后 ， 在 这 种 情况 下 ， 下 一 个 取 指 步骤 发 现 程序 计数 器 中 
的 值 为 8， 于 是 该 地 址 的 指令 将 成 为 下 一 条 被 读 取 和 执行 的 指令 。 


指 4 1 帮 Ee 


操作 码 B 表 示 ， 如 有 果 指定 的 操作 数 的 这 一 部 分 是 要 放 在 
寄存 器 的 内 容 与 寄存 器 0 的 程序 计数 器 中 的 地 址 
内 容 相同 ， 那 么 改变 程序 i 


计数 器 的 值 


操作 数 的 这 部 分 指示 要 与 
寄存 器 0 进行 比较 的 寄存 器 


图 2-9 ”指令 B258 的 译 码 


注意 ， 如 果 该 指令 为 B058， 那 么 该 程序 计数 器 是 否 需 要 更 改 ， 取 决 于 这 个 寄存 器 0 的 内 容 
和 那个 寄存 器 0 的 内 容 是 否 相同 。 不 过 , 这 两 个 寄存 器 是 同一 个 寄存 器 , 因此 内 容 必然 是 相同 的 。 
于 是 ， 无 论 寄存 器 0 的 内 容 是 什么 ， 形 式 为 BOXY 的 指令 都 将 使 程序 转移 至 存储 器 位 置 XY 执 行 。 


2.3.1 程序 执行 的 一 个 例子 


让 我 们 从 机 器 周期 的 角度 看 图 2-7 的 程序 是 如 何 执行 的 。 该 程序 从 主 存储 器 中 取出 两 个 值 ， 
计算 它们 的 和 ， 并 将 结果 存储 在 一 个 主 存储 器 存储 单元 里 。 首 先 ， 我 们 需要 将 该 程序 存放 在 存 
储 器 的 某 个 地 方 。 对 于 这 个 例子 , 假设 该 程序 存放 在 从 地 址 A0 (十 六 进 制 ) 开始 的 连续 地 址 中 。 
在 按照 这 种 方法 存储 好 该 程序 后 ， 要 执行 这 个 程序 只 需要 把 该 程序 的 第 一 条 指令 的 地 址 (A0) 
存放 在 程序 计数 器 里 并 开启 机 器 〈 见 图 2-10)。 

CPU 开始 机 器 周期 的 取 指 步骤 ， 该 步骤 从 主 存储 器 中 取出 存储 在 地 址 A0 的 指令 ， 并 将 该 指 
令 (156C) 放 入 指令 寄存 器 里 〈( 见 图 2-11a)。 注 意 ， 在 我 们 的 机 器 里 ， 指 令 的 长 度 为 16 位 (2 
个 字 节 )。 因 此 ， 要 读 取 的 整个 指令 占用 了 存储 单元 的 地 址 A0 和 Al1。CPU 的 设计 考虑 到 了 这 点 ， 
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它 取 指 时 同时 读 两 个 存储 单元 的 内 容 ， 并 将 获得 的 位 模式 存放 在 长 度 为 16 位 的 指令 寄存 器 中 。 
接着 ，CPU 给 程序 计数 器 加 2， 使 得 该 寄存 器 包含 下 一 条 指令 的 地 址 ( 见 图 2-11b)。 在 第 一 个 机 
器 周期 的 取 指 步骤 结束 时 ， 程 序 计 数 器 和 指令 寄存 器 包含 下 列 数 据 : 

程序 计数 器 ，R2 

指令 寄存 器 : 156C 


程序 计数 器 包含 第 














一 条 指令 的 地 址 
CPU 主 存储 器 
地 址 “单元 
oe] i 
a0 | 总 线 ML [ce] 程序 村 存 入 
ee 所 二 三 人 
| 地 址 里 
”| < 
A4 证 到 
六， 夺权 
指令 琳 存 器 A6 ，” 便 胡 
El A7 ”区 到 
i 8 ， 访 本 
A9 L090| 


图 2-10 ”图 2-7 中 的 程序 被 存储 在 主 存储 器 中 准备 执行 


CPU 主 存储 器 
程序 计数 器 


地 址 元 
3 





(a) 取 指 步骤 开始 时 ， 从 存储 器 中 取出 从 地 址 A0 开 始 的 指令 ， 放 在 指令 寄存 器 中 


CPU 主 存储 器 
| 地 址 单元 
人 Ba 总 线 RMT et 

A2 画 开 
A3 ED 


(b) 然后 增加 程序 计数 器 的 值 ， 使 它 指向 下 一 条 指令 
图 2-11 执行 机 器 周期 的 取 指 步骤 
然后 ，CPU 要 分 析 其 指令 寄存 器 中 的 指令 ， 并 得 出 结论 它 要 把 地 址 为 6C 的 存储 单元 的 内 容 
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加 载 到 寄存 器 5 中 。 该 加 载 工 作 是 在 机 器 周期 的 执行 步骤 完成 的 ， 接 着 CPU 开始 下 一 个 机 器 周期 。 

这 个 周期 首先 要 从 以 地 址 A2 开 始 的 2 个 存储 单元 中 取 指 令 166D。CPU 要 将 此 指令 存 入 指令 
寄存 器 ， 并 将 程序 计数 器 增加 到 A4。 因 此 ， 此 时 的 程序 计数 器 和 指令 寄存 器 中 的 值 如 下 : 

程序 计数 器 : A4 

指令 寄存 器 : 166D 

现在 ，CPU 对 指令 166D 进 行 译 码 ,确定 它 要 将 地 址 为 6D 的 存储 单元 的 内 容 加 载 到 寄存 器 6， 
然后 执行 该 指令 。 这 时 候 ， 寄 存 器 6 才 真 正 加 载 了 数据 。 

因为 该 程序 计数 器 现在 的 值 是 A4, 所 以 CPU 从 这 个 地 址 开始 取 下 一 条 指令 。 于 是 , 指令 5056 
被 放 入 指令 寄存 器 ， 程 序 计 数 器 增加 到 A6。 现 在 ，CPU 对 其 指令 寄存 器 的 内 容 进 行 译 码 ， 然 后 
激活 二 进 制 补 码 加 法 电路 ， 用 寄存 器 5 和 寄存 器 6 作为 输入 执行 加 法 运算 。 

在 该 执行 步 又 中 ， 算 术 / 逻 辑 单 元 执行 所 请 求 的 加 法 运算 ， 将 结果 存 入 寄存 器 0〈 如 控制 单 
元 所 要 求 的 那样 )， 然 后 向 控制 单元 报告 它 已 经 完成 了 任务 。 之 后 CPU 开始 另 一 个 机 器 周期 ， 再 
一 次 借助 程序 计数 器 ， 从 以 存储 地 址 A6 开 始 的 2 个 存储 单元 中 取 下 一 条 指令 〈306E)， 然 后 将 程 
序 计数 器 增加 到 A8， 接 着 译 码 并 执行 该 指令 。 此 时 ， 和 已 经 被 放 在 了 存储 单元 6E 中 。 

下 一 条 指令 从 存储 单元 A8 开 始 读 取 ， 同 时 程序 计数 器 被 增加 到 AA。 指 令 寄存 器 (C000) 
的 内 容 现在 被 译 码 为 停止 指令 。 因 此 ， 机 器 在 该 机 器 周期 的 执行 步骤 停止 ， 程 序 完成 。 

综 上 ， 我 们 看 到 ， 如 果 我 们 需要 遵照 详细 的 指令 列表 执行 程序 ， 那 么 一 个 存放 在 存储 器 里 
的 程序 的 执行 过 程 就 如 同 你 我 都 可 以 做 的 那样 。 我 们 可 以 通过 标记 指令 来 确定 执行 到 的 位 置 ， 
而 CPU 则 利用 程序 计数 器 来 确定 执行 到 的 位 置 。 在 确定 下 一 步 要 执行 什么 指令 后 ， 我 们 需要 读 
该 指令 并 分 析 它 的 含义 ， 然 后 实现 所 请 求 的 任务 并 返回 到 指令 的 列表 ， 为 下 一 条 指令 做 准备 。 
这 与 计算 机 执行 指令 寄存 器 中 的 指令 ， 然 后 从 另 一 个 取 指 步骤 开始 继续 进行 是 一 样 的 。 


2.3.2 程序 与 数据 


许多 程序 可 以 同时 存储 在 一 个 计算 机 的 主 存储 器 里 ， 只 要 它们 的 地 址 不 同 。 机 器 开启 时 运 
行 哪个 程序 可 以 通过 适当 地 设置 程序 计数 器 来 决定 。 

然而 ， 我 们 必须 记 住 : 数据 也 存储 在 主 存储 器 中 ， 也 是 用 0 和 1 编码 的 ， 所 以 机 器 自己 无 法 知道 
哪 是 数据 ， 哪 是 程序 。 如 果 程 序 计 数 器 被 赋予 了 数据 的 地 址 而 非 所 希望 的 程序 的 地 址 ， 那 么 在 没有 
更 好 选择 的 情况 下 , 该 CPU 会 像 取 指令 一 样 读 取 此 数据 的 位 模式 并 执行 。 最 终 的 结果 取决 于 该 数据 。 

然而 ， 我 们 不 应 该 就 此 得 出 结论 ， 以 为 将 程序 和 数据 以 相同 的 形式 存 入 机 器 的 存储 器 是 错误 的 。 
事实 上 , 这 已 经 被 证 明 是 一 个 有 用 的 特性 ， 因 为 它 使 得 某 一 个 程序 可 以 操控 其 他 程序 (甚至 是 自己 )， 
就 像 它 可 以 操控 数据 一 样 。 例如 , 可 以 设想 有 这 样 的 一 个 程序 , 它 可 以 根据 其 与 环境 的 交互 自我 修正 ， 
从 而 表现 出 学 习 能 力 ; 亦 或 有 这 样 一 个 程序 ， 它 可 以 编写 执行 其 他 程序 ， 以 解决 它 所 遇 到 的 问题 。 


问题 与 练习 
1. 假设 在 附录 C 描 述 的 机 器 中 ， 从 地 址 00 到 05 的 存储 单元 中 包含 下 列 〈 十 六 进 制 ) 位 模式 : 
地 址 内 容 
00 14 
ol 02 
02 34 
03 17 
04 co 
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如 果 启 动机 器 时 ,程序 计数 器 被 设 为 00， 那么 该 机 器 停止 时 , 地址 为 十 六 进 制 17 的 存储 单元 里 会 有 什 
么 样 的 位 模式 ? 
2. 假设 在 附录 C 描 述 的 机 器 中 ， 从 地 址 B0 到 B8 的 存储 单元 中 包含 下 列 〈 十 六 进 制 ) 位 模式 : 


地 址 内 容 


B0 13 
Bl B8 
B2 A3 
B3 02 
B4 33 
B5 B8 
B6 C0 
B7 00 
B8 OF 


a. 如 果 程 序 计数 器 最 初 为 B09， 那 么 第 一 条 指令 执行 之 后 ，3 号 寄存 器 中 存储 的 位 模式 是 什么 ? 
b. 在 执行 停止 指令 时 ， 存 储 单元 B8 里 的 位 模式 是 什么 ? 
3. 假设 在 附录 C 描 述 的 机 器 中 ， 从 地 址 A4 到 B1 的 存储 单元 中 包含 下 列 〈 十 六 进 制 ) 位 模式 : 


A4 20 
A5 00 
A6 21 
A7 03 
Ag 22 
A9 01 
AA Bl 
AB BO 
AC 50 
AD 02 
AE B0 
AF AA 
BO C0 
BI1 00 


假设 该 机 器 启动 时 其 程序 计数 器 的 值 为 A4， 请 回答 下 面 的 问题 。 
a 地址 为 AA 的 指令 第 一 次 执行 时 ， 寄 存 器 0 中 是 什么 ? 
b. 地 址 为 AA 的 指令 第 二 次 执行 时 ， 寄 存 器 0 中 是 什么 ? 
c, 该 机 器 停止 之 前 ， 存 放 在 地 址 AA 里 的 指令 执行 了 多 少 次 ? 
4. 假设 在 附录 C 描 述 的 机 器 中 ， 从 地 址 F0 一 F9 的 存储 单元 中 包含 下 列 〈 十 六 进 制 ) 位 模式 ;: 


地 址 内 容 
F0 20 
Fl C0 
F2 30 
F3 F8 
F4 20 
F5 00 
F6 30 
F7 F9 
F8 FF 
F9 FF 


如 果 机 器 启动 时 其 程序 计数 器 的 值 为 F0， 当 到 达 地 址 为 F8 的 指令 时 ， 该 机 器 执行 什么 ? 
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*2.4 算术 /逻辑 指令 


如 前 所 述 ， 算 术 / 罗 辑 指 令 组 由 请 求 算 术 、 逻 辑 和 移 位 运算 的 指令 组 成 。 在 本 节 中 ， 我 们 将 
详细 介绍 这 些 运算 。 
2.4.1 人 逻辑 运算 
第 1 章 介 绍 了 逻辑 运算 AND (与 )、 OR (或 ) 和 XOR ( 异 或 ， 一 般 读 作 “ex-or”)， 它 们 都 
是 组 合 两 个 输入 的 二 进 制 位 ， 得 到 一 个 输出 的 二 进 制 位 。 这 些 运算 可 以 扩展 成 为 这 样 的 按 位 运 
算 (bitwise operation): 组 合 两 个 二 进 制 位 串 ， 在 各 个 列 上 应 用 基本 运算 ， 产 生 一 个 输出 串 。 例 
如 ， 位 模式 10011010 与 11001001 进 行 AND 运 算 所 得 结果 如 下 : 
10011010 
AND 11001001 
10001000 
这 里 ， 我 们 只 是 将 每 一 列 的 两 个 二 进 制 位 的 AND 运 算 结果 写 在 了 那 一 列 的 底部 。 同 理 ， 对 这 些 
位 模式 进行 OR 运算 及 XOR 运 算 时 得 到 的 结果 是 : 


oD tt ee et me me 





10011010 10011010 
QR 11001001 XOR 11001001 
11011011 01010011 


AND 运 算 的 一 个 主要 用 途 是 将 位 模式 的 一 部 分 设 为 0， 而 不 影响 男 外 一 部 分 。 这 一 用 途 在 
实践 中 有 很 多 应 用 ， 如 过 滤 用 RGB 格 式 表示 的 数字 图 像 的 某 些 颜 色 ， 如 前 一 章 中 描述 的 那样 。 
再 看 一 个 例子 ， 如 果 字 节 00001111 是 AND 运 算 的 第 一 个 操作 数 ， 那 么 会 产生 什么 结果 ? 即使 不 
知道 第 二 个 操作 数 的 内 容 ， 我 们 仍然 能 够 得 出 这 样 的 结论 ， 即 结果 的 最 高 4 位 均 为 0。 其 次 ， 结 
果 的 最 低 4 位 将 与 第 二 个 操作 数 的 最 低 4 位 相同 ， 如 下 例 所 示 : 

00001111 
二 
00001010 

AND 运 算 的 这 个 应 用 是 一 个 称 为 屏蔽 (masking) 的 过 程 的 例子 。 这 里 ， 一 个 称 为 掩 码 
(mask) 的 操作 数 决定 另 一 个 操作 数 的 哪个 部 分 会 影响 结果 。 在 这 个 AND 运 算 中 ， 屏 蔽 得 
出 的 结果 中 ， 其 中 一 部 分 是 一 个 操作 数 的 复制 品 ， 没 有 复制 的 部 分 置 0。 在 这 个 上 下 文 
中 ，AND 运 算 的 一 个 简单 应 用 就 是 屏蔽 图 像 像 素 中 与 红色 部 分 相关 联 的 所 有 位 ， 只 留 下 蓝 
色 和 绿色 部 分 。 这 种 转换 在 图 像 操 作 软 件 中 是 经 常 使 用 的 。 

除了 操作 图 像 以 外 ，AND 运 算 在 操作 其 他 类 型 的 位 映射 “bit map) 方面 也 很 有 用 ， 只 要 所 
用 位 串 中 的 每 个 位 表示 的 都 是 一 个 特定 对 象 存 在 与 否 ， 即 可 使 用 。 再 举 一 个 非 图 形 的 例子 ， 一 
个 由 52 位 组 成 的 串 ， 其 中 每 个 位 与 一 张 特定 的 扑克 牌 相 联 系 ， 此 位 串 可 以 表示 一 手 5 张 牌 , 我 们 
只 需要 将 1 赋予 和 手中 牌 相对 应 的 5 个 位 ， 而 将 0 赋予 所 有 其 他 位 。 同 理 ，13 个 位 为 1 的 52 位 位 映 
射 可 以 表示 一 手 桥牌 ，32 位 位 映射 可 以 表示 32 种 口味 冰激凌 的 有 无 。 

接着 ， 假 设 一 个 8 位 存储 单元 被 用 作 一 个 位 映射 ， 我 们 希望 查 明 与 从 高 位 端 算 起 的 第 3 位 相 
联系 的 对 象 是 否 存在 。 我 们 只 需要 将 整个 字 节 与 掩 码 00100000 进 行 AND 运 算 ， 当 且 仅 当 该 位 映 
射 从 高 位 端 算 起 的 第 3 位 本 身 为 0 时 ， 结 果 的 字 节 值 全 为 0。 于 是 ， 在 该 AND 运 算 中 安排 一 个 条 
件 转移 指令 ， 程 序 就 可 以 实现 相应 的 动作 。 其 次 ， 如 果 该 位 映射 从 高 位 端 算 起 的 第 3 位 为 1， 我 
们 想 在 不 破坏 其 他 位 的 情况 下 将 其 改 为 0， 那 么 可 以 把 该 位 映射 与 掩 码 11011111 进 行 AND 运 算 ， 
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然后 用 结果 替代 原来 的 位 映射 。 

AND 运 算 可 用 于 复制 一 个 位 串 的 一 部 分 ， 方 法 是 将 不 复制 的 部 分 置 0，OR 运 算 也 可 用 于 复 
制 一 个 串 的 一 部 分 ， 但 方法 是 将 不 复制 的 部 分 置 1。 为 此 ， 我 们 再 次 使 用 掩 码 ， 但 是 这 次 用 0 来 
指示 要 复制 的 位 的 位 置 ， 用 1 指示 不 复制 的 位 置 。 例 如 ， 一 个 任意 字 节 和 11110000 做 OR 运算 ， 
得 到 的 结果 是 最 高 有 效 4 位 为 1， 其 余 位 是 另外 一 个 操作 数 最 低 有 效 4 位 的 副本 ， 如 下 例 所 示 : 

11110000 
QR 10101010 
11111040 
因此 ， 可 以 用 掩 码 11011111 做 AND 运 算 ， 强 制 一 个 字 节 从 高 位 端 算 起 的 第 3 位 变 为 0，， 用 掩 码 
00100000 做 OR 运算 ， 强 制 同样 的 位 置 变 为 1。 

XOR 运 算 的 一 个 主要 用 途 是 形成 一 个 位 串 的 补 码 。 任 意 一 个 字 节 与 全 部 为 1 的 掩 码 做 XOR 

运算 得 到 的 是 该 字 节 的 补 码 。 例 如 ， 注 意 下 面 示例 中 第 二 个 操作 数 与 结果 的 关系 : 
二 了 二 斑斑 工业 贞 
XOR 10101010 
01010101 

XOR 运 算 可 以 用 于 反 转 一 个 RGB 位 图 图 像 的 所 有 位 ， 结 果 产 生 一 个 “ 反 转 的 ”彩色 图 像 ， 
其 中 浅 色 被 替换 成 深 色 ， 深 色 被 奉 换 成 浅 色 。 

在 附录 C 描 述 的 机 器 语言 中 ， 操 作 码 7、8 和 9 分 别 用 于 逻辑 运算 OR、AND 和 XOR。 每 个 操 
作 码 要 求 2 个 指定 寄存 器 的 内 容 之 间 进 行 相应 的 逻辑 运算 ， 并 将 结果 存放 在 男 一 个 指定 的 寄存 器 
中 。 例 如， 指令 7ABC 要 求 的 是 : 将 寄存 器 B 和 C 的 内 容 进 行 OR 运算 ,并 将 结果 存放 在 寄存 器 A 中 。 


2.4.2 ”循环 移 位 运算 及 移 位 运算 


循环 移 位 运算 及 移 位 运算 提供 了 移动 寄存 器 内 二 进 制 位 的 方法 ， 常 用 于 解决 对 齐 问题 。 这 
些 运算 根据 移动 方向 〈 向 右 或 向 左 ) 和 其 过 程 是 否 循环 来 分 类 。 这 些 分 类 准则 的 混合 使 用 产生 
了 许 许多 多 变 体 。 下 面 我 们 简单 介绍 一 下 所 涉及 的 概念 。 

我 们 来 考虑 含 一 个 字 节 二 进 制 位 的 寄存 器 。 如 果 我 们 将 其 内 容 向 右 移 一 位 ， 我 们 想像 最 右 
端的 位 被 移出 边界 ， 最 左 端 出 现 一 个 空位 。 对 于 这 个 额外 的 位 及 留 出 的 空位 如 何 操作 是 区 别 各 
种 移 位 运算 的 特征 。 一 种 技术 是 将 右 端 移出 的 位 放置 在 左 端的 空位 上 ， 这 类 运算 称 为 循环 移 位 
(circular shift 或 rotation)。 因 此 ， 如 果 我 们 针对 一 个 字 节 的 位 模式 进行 8 次 右 循 环 移 位 ， 那 么 我 
们 得 到 的 位 模式 将 与 初始 位 模式 相同 。 

男 外 一 种 技术 是 丢弃 移出 边界 的 位 , 并 用 0 填充 空位 , 这 类 运算 称 为 逻辑 移 位 (logical shift)。 
这 种 向 左 的 移 位 可 以 实现 2 乘 以 二 进 制 补 码 的 运算 。 因 此 ， 二 进 制 数字 左 移 相当 于 乘 2， 而 十 进 
制 数字 左 移 就 相当 于 乘 10。 此 外 ， 被 2 除 的 运算 可 以 通过 二 进 制 位 右 移 来 完成 。 无 论 哪 种 移 位 ， 
在 使 用 某 种 记 数 法 系统 时 都 必须 注意 保留 符号 位 。 因 此 ， 右 移 时 留 出 的 空位 〈 符 号 位 位 置 ) 总 
是 用 它 原来 的 值 来 十。 保留 符号 位 不 变 的 移 位 称 为 算术 移 位 (arithmetic shift)。 

在 各 种 可 能 的 移 位 和 循环 移 位 指令 中 ， 附 录 C 描 述 的 机 器 语言 仅 包 括 一 条 右 循环 移 位 指 
令 ， 操 作 码 为 A。 在 这 个 移 位 运算 中 ， 操 作 数 的 第 一 个 十 六 进 制 数字 指定 了 要 循环 移 位 的 寄存 
器 ， 操 作 数 的 其 余部 分 规定 了 要 循环 移 位 的 位 数 。 因 此 ， 指 令 A501 的 意思 是 “将 寄存 器 5 的 内 
容 循环 右 移 1 位 ”。 特别 地 ， 如 果 寄 存 器 5 最 初 包含 位 模式 65〈 十 六 进 制 )， 那 么 执行 此 指令 〈 见 
图 2-12) 后 将 包含 B2。( 不 妨 尝试 一 下 如 何 组 合 使 用 附录 C 描 述 的 机 器 语言 提供 的 指令 来 产生 
其 他 移 位 及 循环 移 位 指令 。 例 如 ， 因 为 一 个 寄存 器 的 长 度 为 8 位 ， 所 以 循环 右 移 3 位 与 循环 左 
移 5 位 所 得 结果 一 样 。) 
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ogg 4 2) 和 原始 位 模式 


各 位 向 右 移 1 位 ， 最 右边 
的 位 "移出 "了 边界 ， 被 
放 到 了 另 一 端的 空位 上 





7 最 终 的 位 模式 
图 2-12 ”将 位 模式 65 十 六 进 制 ) 循环 右 移 1 位 
2.4.3 ”算术 运算 


尽管 我 们 已 经 提 到 过 算术 运算 一 一 加 、 减 、 乘 和 除 ， 但 一 些 细 枝 末 节 的 问题 还 需要 再 解释 
一 下 。 首 先 ， 我 们 已 经 看 到 减法 运算 可 以 通过 加 法 及 取 负 来 模拟 。 此 外 ， 乘 法 只 不 过 就 是 反复 
进行 加 法 运算 ， 除 法 就 是 反复 进行 减法 运算 。( 因 为 6 中 可 以 减 去 3 个 2， 所 以 6 除 以 2 等 于 3。) 因 
此 ， 一 些小 型 CPU 都 只 装 有 加 法 指令 ， 或 者 加 法 和 减法 指令 。 

我 们 还 应 该 注意 到 ， 每 种 算术 运算 都 有 许多 变 体 。 对 于 附录 C 描述 的 机 器 语言 里 使 用 的 加 
法 运算 ， 我们 已 经 暗示 了 这 一 点 。 例 如 ， 对 于 加 法 运算 ， 如 果 相 加 的 数值 用 二 进 制 补 码 记 数 法 
存储 ， 此 加 法 过 程 的 实现 就 一 定 是 每 列 数 字 直 接 相 加 。 然 而 ， 如 果 操作 数 用 浮 点 值 存储 ， 加 法 过 
程 则 为 读 取 每 个 操作 数 的 尾数 ， 根 据 指数 字段 将 其 向 左 或 右 移 位 ， 检 查 符号 位 ， 执 行 加 法 ， 最 后 
将 其 结果 翻译 成 浮 点 记 数 法 。 因 此 ， 尽 管 它们 都 是 加 法 运算 ,但 是 机 器 的 实现 过 程 并 不 相同 。 


问题 与 练习 
1. 完成 指定 的 运算 。 
a. 01001011 b. 100000011 [> 1 
AND 10101011 AND 11101100 AND 00101101 
d. 01001011 & 10000011 E ji 
OR -10101011 OR 11101100 OR “00101101 
g. 01001011 h. 100000011 人 | ee dr 
XOR 10101011 XOR 11101100 XOR 00101101 


2. 假设 你 想 从 一 个 字 节 中 分 离 出 中 间 的 4 位 ， 方 法 是 中 间 的 4 位 保持 不 变 ， 将 其 他 4 位 设 为 0。 那 么 必须 
使 用 什么 掩 码 及 什么 运算 ? 
. 假设 你 想 对 一 个 字 节 的 中 间 4 位 取 反 码 ， 其 他 4 位 保持 不 变 。 那 么 必须 使 用 什么 扒 码 及 什么 运算 ? 
4. a. 假设 你 对 一 个 位 串 的 前 2 位 进行 XOR 运 算 ， 然 后 相继 对 每 一 个 结果 与 位 串 的 下 一 个 位 进行 XOR 运 
算 。 那 么 最 后 的 结果 与 该 串 中 1 的 个 数 有 什么 关系 ? 和 
b. 在 对 一 个 信息 编码 时 ， 需 要 确定 使 用 什么 样 的 奇偶 校 验 位 ， 问 题 a 与 此 问题 有 什么 联系 ? 
5. 通常 使 用 逻辑 运算 代替 数值 运算 是 很 方便 的 。 例 如 ， 逻 辑 运算 AND 组 合 两 个 位 的 方法 同 乘法 运算 一 
样 。 哪 一 种 多 辑 运 算 和 两 个 位 的 加 法 几乎 相同 ， 这 种 情况 下 会 导致 什么 问题 ? 


wy 
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CN 


. 用 什么 逻辑 运算 和 什么 掩 码 能 将 ASCII 码 中 的 小 写字 母 变 为 大 写字 母 ? 大 写 变 小 写 时 呢 ? 
. 对 下 列 位 串 执行 循环 右 移 3 位 会 得 到 什么 结果 ? 


一 


a. 01101010 b. 00001111 A i 

8. 对 下 面 用 十 六 进 制 记 数 法 表示 的 字 节 ， 执 行 循环 左 移 1 位 的 运算 ， 结 果 是 什么 ? 请 用 十 六 进 制 形式 
给 出 答案 。 
a. AB b. 5C c. B7 d4.35 


9. 一 个 8 位 位 串 循环 右 移 3 位 等 价 于 循环 左 移 多 少 位 ? 

10. 如 果 位 模式 01101010 与 11001100 是 以 二 进 制 补 码 记 数 法 表示 的 值 ， 那 么 它们 的 和 的 位 模式 是 什么 ? 
如 果 这 两 个 位 模式 是 用 第 1 章 讨 论 的 浮 点 格式 表示 的 呢 ? 

11. 使 用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 , 将 地 址 为 A7 的 存储 单元 的 最 高 有 效 位 置 为 1， 其 他 位 的 值 
保持 不 变 。 

12. 使 用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 , 将 存储 单元 E0 的 中 间 4 位 复制 到 存储 单元 El 中 的 最 低 4 位 ， 
并 将 存储 单元 E1 的 最 高 4 位 置 为 0。 


*2.5 与 其 他 设备 通信 


主 存储 器 和 CPU 构成 了 计算 机 的 核心 。 本 节 将 研究 这 个 核心 〈 将 称 它 为 计算 机 ) 如 何 
与 外 围 设 备 通 信 ， 如 海量 存储 系统 、 打 印 机 、 键 盘 、 鼠 标 、 显 示 屏 、 数 码 相 机 甚至 其 他 计 
算 机 。 


2.5.1 控制 器 的 作用 


计算 机 与 其 他 设备 的 通信 通常 是 通过 称 为 控制 器 〈controller) 的 中 间 设 备 来 处 理 的。 对 于 
个 人 计算 机 ， 控 制 器 可 能 由 计算 机 主板 上 固定 安装 的 电路 组 成 ， 有 时 为 了 灵活 ， 它 还 会 以 电路 
板 的 形式 插 在 主板 的 插 槽 中 。 无 论 哪 种 形式 , 控制 器 都 是 通过 电缆 与 计算 机 机 箱 里 的 外 围 设备 ， 
或 者 是 与 计算 机 背面 称 为 端口 〈port) 的 连接 器 相连 接 的 ， 端 口上 可 以 插 其 他 设备 。 这 些 控制 
器 有 时 候 本 身 就 是 小 型 计算 机 ， 每 个 都 有 其 自己 的 存储 电路 和 简单 的 CPU， 可 以 执行 引导 控制 
器 活动 的 程序 。 

控制 器 将 信息 和 数据 在 两 种 形式 之 间 来 回 翻译 : 一 种 是 与 计算 机 内 部 特征 相 适 应 的 形式 ， 
另外 一 种 是 与 所 连接 的 外 围 设 备 相 适应 的 形式 。 最 初 ， 每 个 控制 器 都 是 为 特定 类 型 的 设备 设计 
的 ， 因 此 ， 购 买 一 种 新 的 外 围 设备 常常 还 需要 同时 购买 一 种 新 的 控制 器 。 

最 近 ， 人 们 已 经 开始 开发 个 人 计算 机 标准 ， 如 通用 串 行 总 线 (universal serial bus，USB ) 
和 火线 (FireWire)， 这 样 一 个 控制 器 就 可 以 处 理 多 种 设备 。 例 如 ， 一 个 USB 控 制 器 可 以 用 作 计 
算 机 与 其 他 任何 同 USB 兼 容 的 系列 设备 的 接口 。 现 在 ， 市场 上 可 以 与 USB 控 制 器 通信 的 设备 包 
括 鼠 标 、 打 印 机 、 扫 描 仪 、 海 量 存储 设备 、 数 码 相 机 ， 以 及 智能 手机 。 

每 一 个 控制 器 通过 连接 到 相同 的 总 线 ( 该 总 线 用 来 连接 计算 机 的 CPU 和 主 存储 器 〉 完 成 与 
计算 机 的 通信 〈( 见 图 2-13)。 由 于 这 种 连接 ， 每 个 控制 器 都 能 够 监视 到 CPU 与 主 存 储 器 之 间 正 在 
发 送 的 信号 ， 还 能 够 将 自己 的 信号 插入 总 线 。 

通过 这 种 安排 ，CPU 能 够 以 与 主 存储 器 通信 的 方式 与 连接 在 总 线 上 的 控制 器 通信 。 为 了 给 
控制 器 发 送 一 个 位 模式 ， 首 先 要 在 CPU 的 其 中 一 个 通用 寄存 器 中 构建 该 位 模式 ， 然 后 由 CPU 执 
行 一 个 类 似 STORE 指 令 的 指令 ， 将 该 位 模式 “存储 ”到 控制 器 中 。 类 似 地 ， 当 要 从 一 个 控制 器 
接收 一 个 位 模式 时 ， 要 使 用 一 条 类 似 LOAD 指 令 的 指令 。 
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CD 驱动 器 调制 解 调 器 





控制 器 “”” | ， 掉 制 器 


监视 器 磁盘 驱 动 器 ， 


图 2-13 ”与 机 器 总 线 连接 的 控制 器 












a Pi ei WE dh pede 
过 的 的 六 一 个 近 制品 视 供 多 个 名 补 让 轩 江 和光 认 的 于 


与 控制 Sp 内 pi 性 翻 译 成 相 同 ee es we 
添加 新 设备 就 不 再 需要 增加 新 的 控制 器 ， 只 甫 间 半 3 羔 罗 的 设 千 梳 N0B 铺 
FireWire 兼 容 的 设备 插入 FireWire 端 口 即 可 。 ny | 

相 比 而 言 ，FireWire 的 传输 速率 更 高 ， 和 是 0gB 2 Ad na 9 
众 市 场 的 竞争 中 突出 地 位 。 人 "从 列 侯 的 六 本 是 3 0 版 ， 所 


以 及 为 备份 应 用 设计 的 海量 存储 系统 ， Fe 应 用 直 向 于 各 中 在 二 要 更 人 
上 ， 如 摄像 机 和 联机 海量 存储 系统 。 


在 一 些 计算 机 的 设计 中 ， 通 过 控制 器 的 数据 传输 〈 输 入 与 输出 ) 直接 使 用 LOAD 和 STORE 操作 
码 〈 这 些 操 作 码 已 经 用 于 同 主 存储 器 的 通信 )。 在 这 种 情况 下 ， 每 个 控制 器 都 被 设计 为 啊 应 唯一 一 
组 地 址 的 引用 , 而 主 存 储 器 被 设计 成 忽略 对 这 些 位 置 的 引用 。 因 此 ， 当 CPU 在 总 线 上 发 送 一 条 消息 ， 
要 把 一 个 位 模式 存储 到 一 个 分 配给 某 个 控制 器 的 存储 器 位 置 时 ， 这 个 位 模式 实际 上 是 “存储 ”到 该 
控制 器 中 ， 而 不 是 主 存 储 器 中 。 同 理 ， 如 果 CPU 试 图 从 这 样 的 存储 器 位 置 读 取 数据 (如 用 LOAD 指 
令 )， 那 么 它 所 接收 到 的 位 模式 将 来 自控 制 器 而 不 是 存储 器 。 这 样 的 通信 系统 称 为 存储 映射 输入 / 输 
出 (memory-mapped IO )， 因 为 该 计算 机 的 输入 /输出 设备 好 像 是 在 各 种 存储 器 位 置 里 〈 见 图 2-14)。 


总 线 | ， 出 存 
依 器 


一 日 -Nl 一 外 围 设备 


图 2-14 存储 映射 输入 /输出 的 概念 表示 
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另外 一 种 存储 映射 输入 /输出 是 在 机 器 语言 中 提供 特定 的 操作 码 , 用 以 规定 通过 控制 器 的 数 
据 传 输 (输入 与 输出 )。 具 有 这 些 操 作 码 的 指令 称 为 LO 指令 。 例如， 如 果 附录 C 中 描述 的 机 器 语 
言 遵循 这 种 方法 ， 它 可 能 包括 诸如 F5A3 这 样 的 指令 ， 表 示 “ 将 寄存 器 5 的 内 容 存 储 在 由 位 模式 
A3 指 定 的 控制 器 中 ”。 


2.5.2 ”直接 存储 器 存 取 


因为 控制 器 是 连接 到 计算 机 的 总 线 上 的 ， 所 以 它 能 在 CPU 不 使 用 总 线 的 几 纳 秒 时 间 里 实现 
与 主 存储 器 的 通信 。 控 制 器 这 种 存 取 主 存储 器 的 能 力 称 为 直接 存储 器 存 取 (direct memory 
access，DMA )， 它 是 计算 机 性 能 的 重大 资本 。 例 如 ， 要 从 磁盘 扇 区 检索 数据 ，CPU 可 以 将 编码 
为 位 模式 的 请 求 发 送 给 连接 这 个 磁盘 的 控制 器 ， 要 求 该 控制 器 读 取 这 个 扇 区 并 将 数据 存储 在 指 
定 的 主 存储 器 区 域 中 。 在 该 控制 器 执行 此 读 操作 并 通过 DMA 将 数据 存储 在 主 存储 器 时 ，CPU 可 
以 继续 执行 其 他 任务 。 因 此 ， 这 两 个 活动 将 会 被 同时 执行 。CPU 将 执行 某 个 程序 ， 而 控制 器 则 
监视 磁盘 与 主 存储 器 之 间 的 数据 传输 。 这 样 ， 在 数据 传输 相对 绥 慢 时 ，CPU 的 计算 资源 不 会 被 
浪费 。 

使 用 DMA 同 样 也 有 不 利 影响 ， 它 会 使 计算 机 总 线 的 通信 复杂 化 。 位 模式 必须 在 CPU 与 主 存 
储 器 之 间 、CPU 与 每 个 控制 器 之 间 ， 以 及 每 个 控制 器 与 主 存储 器 之 间 进 行 传送 。 协 调 总 线 上 的 
所 有 这 些 活动 是 个 很 大 的 设计 难题 。 即 使 设计 非常 出 色 ，CPU 与 控制 器 竞争 总 线 存 取 时 ， 中 央 
总 线 也 可 能 成 为 障碍 。 此 障碍 称 为 汉 。 诺 依 曼 瓶 颈 (von Neumann bottleneck)， 因 为 它 源 于 冯 。 诺 
依 曼 体系 结构 〈von Neumann architecture )， 在 该 结构 中 ，CPU 是 通过 中 央 总 线 从 存储 器 读 
取 指 令 的 。 


2.5.3 ”握手 


两 个 计算 机 部 件 之 间 的 数据 传输 很 少 是 单 向 进行 的 。 即 使 我 们 可 以 把 打印 机 看 作 是 接收 数 
据 的 设备 ， 但 事实 上 它 也 向 计算 机 发 送 数据 。 毕 竟 ， 计 算 机 产生 字符 并 向 打印 机 发 送 字 符 的 速 
度 要 远 远 快 于 打印 机 能 够 打印 的 速度 。 如 果 计 算 机 盲目 地 把 数据 发 送 给 打印 机 ， 那 么 打印 机 很 
快 就 会 落 在 后 面 ， 导 致 数据 丢失 。 因 此 ， 诸 如 打印 文档 这 样 的 过 程 都 会 涉及 持续 的 称 为 握手 
(handshaking) 双向 对 话 ， 计 算 机 和 外 围 设 备 通过 这 种 双向 对 话 交换 设备 的 状态 信息 ， 协 调 它们 
之 间 的 活动 。 

握手 通常 涉及 一 个 状态 字 〈status word)， 它 是 由 外 围 设备 生成 并 发 送 给 控制 器 的 一 个 位 模 
式 。 该 状态 字 是 一 个 位 映射 ， 其 中 的 各 个 二 进 制 位 反映 了 该 设备 的 各 种 情况 。 以 打印 机 为 例 ， 
其 状态 字 的 最 低 有 效 位 的 值 可 以 表示 该 打印 机 是 否 缺 纸 ， 而 下 一 个 位 可 以 表示 该 打印 机 是 否 已 
经 准备 好 再 接收 数据 ， 另 外 还 有 一 个 位 可 用 于 指出 是 否 卡 纸 了 。 控 制 器 是 自己 响应 这 些 状态 信 
息 ， 还 是 交 由 CPU 来 处 理 ， 这 取决 于 不 同 的 系统 。 无 论 哪 种 情况 ， 状 态 字 都 提供 了 一 种 机 制 ， 
用 于 协调 与 外 围 设备 的 通信 。 


2.5.4 流行 的 通信 媒介 


两 个 计算 设备 之 间 的 通信 可 通过 两 种 途径 来 处 理 : 并 行 及 串 行 。 这 两 个 术语 指 的 是 传输 信 
号 的 方式 。 并 行 通信 (parallel communication ) 是 指 若干 信号 同时 传输 , 每 个 信号 都 在 各 自 的 “ 线 
路 ”上 。 这 种 技术 传输 数据 的 速度 快 ， 但 是 需要 相对 复杂 的 通信 路 径 。 例 如 ， 计 算 机 的 内 部 总 
线 ， 其 中 多 条 线路 被 用 于 同时 传输 大 量 数据 块 及 其 他 信和 号 。 

与 此 相反 ， 串 行 通信 (serial communication ) 是 指 信号 在 一 条 线路 上 一 个 接 一 个 地 传输 。 
相对 于 并 行 通信 ， 串 行 通信 只 需要 一 条 相对 简单 的 数据 路 径 ， 这 也 是 它 很 流行 的 原因 。USB 
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与 FireWire， 能 在 短 短 几 米 的 距离 内 提供 相对 高 速 的 数据 传输 ， 是 串 行 通信 系统 的 例子 。 对 于 相 
对 较 长 的 距离 〈 在 家 中 或 者 办 公 楼 里 )， 通 过 以 太 网 连接 〈 见 4.1 节 ) 的 串 行 通信 ， 无 论 是 通过 
电线 连接 还 是 通过 无 线 电 广播 连接 ， 都 很 流行 。 

多 年 来 ， 传 统 的 语音 电话 线 在 远 距离 通信 方面 一 直 主 宰 着 个 人 计算 机 和 领域。 这些 通信 路 径 都 只 
有 一 根 电 线 并 通过 它 逐 一 传输 语音 信号 , 本 质 上 属于 串 行 系统 。 这样 的 数字 数据 传输 实现 过 程 如 下 : 
首先 利用 调制 解 调 器 (modulator-demodulator， 简 写 为 modem) 将 位 模式 转换 为 听 得 见 的 音调 ， 并 
通过 电话 系统 串 行 传输 ， 然 后 在 目的 地 由 另 一 个 调制 解 调 器 将 这 些 音 调 重 新 转换 成 二 进 制 位 。 

为 了 通过 传统 的 电话 线 实 现 更 加 快速 的 远 距离 通信 ， 电 话 公司 提供 了 一 种 称 为 数字 用 户 线 
(Digital Subscriber Line，DSL) 的 服务 ， 它 利用 了 以 下 事实 : 现 有 的 电话 线 实际 上 能 够 处 理 比 
传统 语音 通信 所 用 频率 范围 更 宽 的 频率 范围 。 确 切 地 说 ，DSL 是 将 高 于 可 听 范 围 的 频率 用 于 传 
输 数 字数 据 ， 而 将 较 低频 谱 用 于 语音 通信 。 虽 然 DSL 已 非常 成 功 ， 但 电话 公司 也 在 迅速 将 自己 
的 系统 升级 为 光纤 线 (光纤 线 比 传统 电话 线 更 容易 支持 数字 通信 )。 

线 缆 调制 解 调 器 (cable modem) 是 一 种 竞争 技术 ， 它 可 以 调制 和 解 调 位 横 式 ， 使 其 能 够 在 
有 线 电视 系统 上 传输 。 许 多 线 缆 提 供 商 现在 都 同时 使 用 光纤 线 和 传统 的 同 轴 电 缆 ， 同 时 提供 高 
清晰 度 电 视 信 号 和 计算 机 网 络 访问 。 

卫星 链 路 通过 高 频 无 线 电 广 播 甚至 能 使 一 些 远离 高 速 电话 和 有 线 电 视 网 络 的 偏远 地 区 访问 
到 计算 机 网 络 。 


2.5.5 通信 速率 


一 个 计算 部 件 与 男 外 一 个 计算 部 件 之 间 传 输 数 据 位 的 速率 是 以 比特 每 秒 (bits per second， 
bps， bit/s) 计量 的 。 常用 的 单位 有 Kbit/s (kilo-bps 的 简写 , 即 千 比特 每 秒 , 等 于 103 bit/s)、Mbit/s 
(mega-bps 的 简写 ， 即 兆 比 特 每 秒 ， 等 于 10 bit/s〉 和 Gbit/s (giga-bps 的 简写 ， 即 吉 比 特 每 秒 ， 
等 于 10?bit/s)。 注 意 位 与 字 节 之 间 的 区 别 : 8 Kbit/s 相 当 于 1 KB/s。 使 用 简写 形式 时 ， 小 写 的 英文 
字母 b 通 常 表示 位 〈bit)， 而 大 写 的 英文 字母 B 通 常 表示 字 节 (byte)。 

对 于 短 距离 通信 ，USB 2.0 及 FireWire 可 以 提供 几 百 Mbit/s 的 传输 速率 ， 对 于 大 多 数 多 媒体 
应 用 已 经 足够 了 。 再 加 上 便利 性 及 相对 低 价 ， 如 今 它们 已 被 广泛 用 于 家 用 计算 机 与 本 地 外 围 设 
备 〈 如 打印 机 、 外 部 磁盘 驱动 器 及 相机 ) 之 间 的 通信 。 

通过 结合 多 路 复 用 技术 (multiplexing， 数 据 编码 或 混合 ， 使 得 一 条 通信 路 径 可 完成 多 条 通 
信 路 径 的 功能 ) 及 数据 压缩 技术 ,传统 的 语音 电话 系统 能 够 支持 57.6 Kbit/s 的 传输 速率 。 这 无 法 
满足 当今 多 媒体 和 因特网 应 用 (如 来 自 Netflix 或 YouTube 这 类 网 站 的 高 清 视频 流 ) 的 需要 。 播 放 
MP3 音 乐 录音 需要 大 约 64 Kbit/s 的 传输 速率 ， 即 使 播放 低 品 质 的 视频 也 需要 用 Mbit/s 计 量 的 传输 
速率 。 这 正 是 能 够 提供 Mbit/s 范 围 的 传输 速率 的 DSL、 线 缆 以 及 卫星 链 路 等 已 取代 传统 音频 电话 
系统 的 原因 。( 例 如 ，DSL 提 供 的 传输 速率 是 54 Mbit/s 级 的 。) 

一 个 特定 设置 可 获得 的 最 大 速率 ， 取 决 于 通信 路 径 的 种 类 以 及 其 实现 过 程 中 使 用 的 技术 。 
这 个 最 大 速率 通常 大 致 等 同 于 通信 路 径 的 带宽 (bandwidth)， 但 带宽 这 个 术语 除了 传输 速率 这 
个 含义 之 外 还 有 容量 的 含义 。 也 就 是 说 ， 说 一 条 通信 路 径 具 有 高 带宽 (或 提供 宽带 服务 ) 意味 
着 一 条 通信 路 径 能 以 高 速率 传输 位 ， 同 时 意味 着 该 通信 路 径 还 能 够 同时 携带 大 量 信息 。 


问题 与 练习 


1. 假设 附录 C 描 述 的 机 器 使 用 存储 映射 输入 /输出 ， 地 址 B5 是 打印 机 端口 所 在 的 位 置 ， 要 打印 的 数据 应 
a. 如 果 寄 存 器 7 包含 字母 A 的 ASCII 码 , 那么 要 通过 打印 机 打印 该 字母 , 应 该 使 用 哪 条 机 器 语言 指令 ? 
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b. 如 果 该 计算 机 每 秒 执行 100 万 条 指令 ， 那 么 在 1 秒 内 可 以 向 打印 机 发 送 这 个 字符 多 少 次 ? 
如 果 该 打印 机 每 分 名 可 以 打印 5 页 传统 文本 ， 那么 在 (b) 的 情况 下 ， 它 能 够 跟 得 上 发 送 给 它 的 字 
ne 

2. 假设 你 的 个 人 计算 机 硬盘 的 转速 为 每 分 钟 3000 转 ， 每 个 磁道 有 16 个 扁 区 ， 每 个 户 区 有 1024 字 节 。 如 
果 磁盘 控制 器 打算 从 磁盘 驱动 器 中 接收 从 旋转 贡 盘 中 读 到 的 位 ,那么 磁盘 驱动 器 与 磁盘 控制 器 之 间 的 
通信 速率 大 约 是 多 少 ? 

3. 一 本 用 16 位 Unicode 字 符 编码 的 300 页 小 说 ， 按照 54 Mbiys 的 传输 速率 需要 传输 多 入 ? 


EB PIN 和 ee EV TE OT ET TEP DA EAE EE Ee 


*2.6 ”数据 操控 编程 


诸如 Python 这 样 的 计算 机 程序 设计 语言 的 一 个 基本 特征 是 ， 向 用 户 屏蔽 机 器 最 底层 的 乏味 的 
工作 细节 。 刚 刚 用 了 多 半 章 的 篇 幅 介 绍 了 计算 机 处 理 器 中 最 底层 的 数据 操控 ， 回 顾 一 下 Python 脚 
本 屏蔽 无 需 程序 员 操心 的 主要 细节 是 有 益 的 。 

我 们 将 在 第 6 章 更 详细 地 探讨 ， we) 语言 语句 为 了 执行 会 映射 为 低级 机 器 指令 。 一 
条 Python 语 句 可 能 会 映射 为 一 条 机 器 指令 ， 也 可 能 会 映射 为 数 十 或 者 数 百 条 机 器 指令 ， 具 体 取 
决 于 语句 的 复杂 性 和 机 器 语言 的 效率 。 nl Me 和 计算 机 操作 系统 软件 
的 其 他 元 素 是 一 致 的 ， 会 为 每 个 特定 的 计算 机 处 理 器 处 理 这 个 映射 过 程 。 因 此 ，Python 程 序 员 
无 需 知道 自己 的 Python 脚本 是 在 一 个 RISC 处 理 器 上 执行 ， 还 是 在 一 个 CISC 处 理 器 上 执行 。 

我 们 会 认识 许多 与 现代 计算 机 或 附录 C 所 描述 的 简单 机 器 中 所 具有 的 基本 机 器 指令 密切 对 
应 的 Python 操作 。Python 的 整数 加 法 和 浮 点 数 加 法 明显 类 似 于 附录 C 所 描述 的 简单 机 器 的 ADD 
操作 码 。 给 变量 赋值 一 定 会 涉及 某 个 安排 中 的 LOAD、STORE 和 MOVE 操 作 码 。Python 不 用 我 
们 操心 都 使 用 了 哪些 处 理 器 寄存 器 ， 它 利用 机 器 操作 码 来 执行 我 们 的 指令 。 我 们 无 法 看 到 指令 
寄存 器 、 程 序 计数 器 或 者 存储 单元 地 址 ， 但 是 Python 脚本 是 一 条 语句 接着 一 条 语句 顺序 执行 的 ， 
和 简单 机 器 语言 程序 的 执行 方式 一 样 。 


2.6.1 逻辑 运算 和 移 位 运算 


逻辑 运算 和 移 位 运算 可 以 在 任何 类 型 的 数值 数据 上 执行 ， 但 因为 它们 经 常 处 理 数据 的 各 个 
二 进 制 位 ， 所 以 用 二 进 制 值 为 例 来 说 明 这 些 运算 是 最 容易 的 。 就 像 Python 使 用 0x 前 级 指定 十 六 
进 制 值 一 样 ，0b 前 级 可 用 于 指定 二 进 制 值 。 

x = 0b00110011 

mask = 0b00001111 


注意 ， 实 际 上 ， 这 与 给 x 赋值 51( 它 的 三 进 制 值 是 110011) 或 者 0x33 (这 是 51 的 十 六 进 制 
表示 ) 没什么 不 同 ， 与 给 mask 赋 值 15〈 它 的 二 进 制 值 是 1111) 或 者 0x0F (15 的 十 六 进 制 表 示 ) 
也 没什么 不 同 。 我 们 在 Python 赋值 语句 里 使 用 的 拼 出 整数 值 的 表示 ， 不 会 改变 这 个 值 在 计算 机 
中 的 表示 ， 而 只 是 为 了 阅读 的 人 能 理解 它 。 

2.4 节 介绍 了 每 个 按 位 逻辑 运算 符 的 内 置 Python 运算 符 。 





PEint(0b00000101 ^ 0b00000100) # Prints 5 XOR 4, which is 1 
print (0b00000101 | 0b00000100) # Prints 5 OR 4, which is 5 
print (0bO00000101 & 0b00000100) # Prints 5 AND 4, which is 4 


QD 这 个 语法 是 最 近 加 到 演变 的 Python 语言 中 的 。 请 确保 你 使 用 的 是 最 新 的 Python 3 来 复制 这 些 示例 。 
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因此 ， 我 们 可 以 将 2.4 节 中 的 每 一 个 示例 问题 复制 为 Python 代码 。 


# 10011010 
print (0b10011010 & 0b11001001) # AND 11001001 
# 10001000 
# 10011010 
print (0b10011010 | 0b11001001) # OR 11001001 
# 11011011 
# 10011010 
print (0b10011010 ^ 0b11001001) # XOR 11001001 
# 01010011 


对 于 所 有 这 些 示 例 ，Python 会 用 它 默 认 的 输出 表示 即 十 进 制 ) 来 打印 这 个 结果 。 如 果 用 
户 也 喜欢 用 二 进 制 记 数 法 显示 输出 结果 ， 那 么 可 以 用 内 置 函数 将 整数 值 转换 成 与 二 进 制 表示 相 
对 应 的 字符 0 和 1 组 成 的 串 。 

print (bin (0bl0011010 & 0b11001001))  # Prints "0b10001000" 


print (bin (0b10011010 | 0bl1001001) ) #$ Prints "ObLEOLTLOL1" 
print (bin(0b10011010 ^ 0b11001001)) # Prints "0b1010011" 


因为 较 新 版 的 Python 可 以 使 用 任意 个 数字 来 表示 一 个 数 ， 不 打印 开头 的 0， 所 以 上 面 的 第 3 
行 只 打印 了 7 个 数字 ， 而 不 是 8 个 。 

Python 用 于 执行 逻辑 移 位 运算 的 内 置 运 算 符 由 两 个 大 于 号 (>>) 和 两 个 小 于 号 (<<) 组 成 ， 
直观 地 显示 了 移 位 方向 。 运 算 符 右边 的 操作 数 指示 了 要 移 位 的 位 位 置 数 。 

print (0b00111100 >> 2) # Prints "15", which is 0b00001111 

print (0b00111100 << 2) # Prints "240", which is 0bll110000 


将 位 进行 移 位 除了 能 屏蔽 二 进 制 数 的 左边 或 右边 , 位 移 位 运算 符 还 是 一 种 有 效 的 乘 以 2 的 震 
( 左 移 ) 或 者 除 以 2 的 寡 〈 右 移 ) 的 方法 。 


2.6.2 ”控制 结构 


本 章 前 面 介 绍 的 机 器 语言 控制 组 指令 为 我 们 提供 了 一 种 从 程序 的 一 个 位 置 跳 转 到 另 一 个 位 
置 的 机 制 。 在 Python 这 样 的 高 级 语言 中 ， 这 实现 了 所 谓 的 控制 结构 〈control structure)， 使 我 们 
能 更 有 力 地 表达 算法 的 语法 模式 。 这 方面 的 一 个 例子 是 if 语 名 ， 它 允许 代码 段 在 脚本 中 的 布尔 
值 不 为 真 的 情况 下 被 条 件 性 地 跳 过 。 

if (water temp > 140) : 

Print('Bath water too hot!') 

直观 来 看 ， 这 个 Python 片段 将 被 映射 为 多 条 机 器 指令 ， 对 water_temp 变 量 和 整数 值 140 进 
行 比 较 ， 二 者 很 可 能 是 事先 载 入 寄存 器 的 。 如 果 water_temp 值 不 是 140 或 者 更 大 ， 条 件 转移 指 
令 会 跳 过 内 置 print () 函数 的 机 器 指令 。 

另 一 种 控制 结构 是 循环 结构 while， 它 允许 一 个 代码 段 被 执行 多 次 ,一 般 受 某 个 条 件 控制 。 

while (n < 10): 


print (n) 


均 三 及 二 11 


假设 变量 n 从 小 于 10 的 值 开始 ， 这 个 循环 会 一 直 打 印 n 并 在 n 上 加 1， 直 到 它 变 为 大 于 或 等 于 
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10 的 数 为 止 。 

我 们 将 在 第 5 童 及 以 后 的 章节 中 [0] 用 更 多 的 时 间 来 研究 这 些 控制 结构 和 其 他 控制 结构 。 现 
在 ， 我 们 重点 研究 “人 允许 我 们 从 程序 的 一 个 位 置 跳 转 到 另 一 个 位 置 ， 在 那里 执行 一 个 要 求 的 任 
务 之 后 再 返回 到 之 前 所 在 的 程序 点 ”的 机 制 。 

函数 

我 们 已 经 看 到 了 3 种 不 遵循 算 林 运算 和 轴 辑 运算 语法 形式 的 内 置 Python 运算 。Print ()、 
stz () 和 bin () 运算 都 是 使 用 特定 名 称 而 不 是 符号 来 调用 的 ， 而 且 它 们 的 操作 数 外 面 还 包 有 括号 。 

这 两 个 都 是 一 种 称 之 为 函数 〈function) 的 Python 语言 特性 的 例子 。 在 数学 中 ， 术 语 函 数 经 
常用 于 描述 代数 关系 ， 如 “fx) = 闻 +3x+4?。 当 看 到 这 种 函数 定义 时 ， 我 们 就 明白 ， 在 随后 的 
行 中 ， 表 达 式 “AS5)” 的 意思 就 是 值 5 应 该 被 插入 到 定义 九 ) 的 表达 式 中 参数 x 所 在 的 位 置 上 。 因 
此 ，KH5)=S +3X5s+4=25+15+4=44。 程 序 设计 语言 函数 都 是 非常 相似 的 ， 因 为 它们 都 允 
许 我 们 使 用 一 个 名 称 来 指 代 一 系列 应 该 在 给 定 的 一 个 参数 或 多 个 参数 上 执行 的 运算 。 由 于 这 个 
语言 特性 被 映射 为 较 低 级 的 机 器 语言 的 方式 ， 表 达 式 或 语句 中 的 函数 的 出 现 被 称 作 函 数 调用 
(function call)， 有 时 称 为 调用 〈calling) 函数 。 

上 面 例子 中 出 现 的 print () 和 bin() 就 是 两 个 这 样 的 函数 调用 : 它们 指明 Python 解释 器 要 
执行 的 指定 函数 的 定义 , 然后 返回 继续 它们 的 工作 。 语法 是 在 函数 名 称 后 面 紧 接着 放 一 个 开 括号 ， 
然后 给 出 函数 参数 值 (argument value)， 用 于 在 对 函数 定义 进行 求 值 时 插入 参数 ， 最 后 跟 一 个 闭 
括号 。 开 括号 与 闭 括 号 的 匹配 很 重要 一 一 不 匹配 会 导致 Python 语法 错误 , 这 是 初学 者 常 犯 的 错误 。 

从 现在 起 ， 我 们 将 遵从 我 们 讨论 Print () 这 样 的 Python 函数 时 提 到 的 括号 使 用 约定 ， 以 便 
清楚 地 表示 它们 与 变量 或 其 他 项 不 同 。 

函数 有 许多 种 类 ， 比 我 们 看 到 的 多 。 有 些 函 数 有 多 个 参数 ， 如 max () 函数 : 


x 1034 


y= 1056 

z = 2078 

biggest = max (x, y, 2z) 

print (biggest) # Prints "2078™ 


括号 内 的 多 个 参数 是 由 逗号 分 隔 的 。 有 些 函 数 返 回 (return) 值 ， 也 就 是 说 ， 这 种 函数 调 
用 本 身 可 以 出 现在 一 个 更 复杂 的 表达 式 中 ,或 者 出 现在 赋值 语句 的 右边 。 这 些 函 数 有 时 称 
为 有 返回 值 函 数 (fruitful function)。max() (如 上 ) 和 bin() 都 是 这 种 函数 ， 它 们 以 整数 
值 为 参数 , 返回 相应 的 由 0 和 1 组 成 的 串 。 其 他 函数 不 返回 值 , 通常 被 用 作 独 立 语句 ,，print () 
就 是 这 种 函数 。 不 返回 值 的 函数 有 时 称 为 无 返回 值 函 数 (void function) 或 过 程 (procedure)， 
虽然 它们 在 Python 的 语法 规则 中 没有 区 别 。 将 无 返回 值 函 数 的 结果 赋值 给 变量 是 没有 意义 
的 ， 如 


x = print('hello world!') # x is assigned None 
虽然 在 Python 里 这 不 是 错误 ， 但 它 与 根本 不 给 x 赋 值 还 不 太一 样 。 

到 目前 为 止 ， 我 们 所 看 到 的 函数 都 是 Python 知道 的 内 置 函数 ， 这 种 函数 有 几 十 个 ， 但 还 有 
一 些 更 高 级 的 脚本 可 以 引用 的 附加 函数 的 扩展 库 。Python 库 模块 包含 许多 可 能 一 般 用 不 到 但 当 
需要 的 时 候 就 可 以 调用 的 有 用 函数 。 

# Calculates the hypotenuse of a right triangle 

import math 


sideA = 3.0 
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sideB = 4.0 
# Calculate third side via Pythagorean Theorem 
hypotenuse = math.sqrt (sideA**2 + sideB**2) 


print (hypotenuse) 


在 这 个 例子 中 ，import 语 句 预先 警告 了 Python 解 释 器 : 这 个 脚本 引用 的 是 名 为 “math” 的 
库 , 它 恰 巧 是 Python 配备 的 一 组 标准 库 模 块 中 的 一 个 。math 库 模块 中 定义 的 sqrt () 函数 提供 了 
参数 的 平方 根 ， 在 这 个 例子 里 ， 参 数 是 表达 式 “sideA 的 平方 加 上 sideB 的 平方 "”。 注意 ， 库 函 
数 调用 包括 模块 名 (math) 和 函数 名 (sqrt)， 中 间 由 一 个 点 连接 。 

Python 的 math 模 块 包括 几 十 个 有 用 的 数学 函数 ， 包 括 对 数 函 数 、 三 角 函 数 和 双 曲 函数 ， 还 
有 一 些 熟悉 的 常数 值 ， 如 math.Pi。 

除了 内 置 模块 函数 和 库 模 块 函数 ，Python 还 为 脚本 提供 了 语法 来 定义 其 自己 的 函数 。 我 们 
将 在 本 节 末 尾 定义 一 些 非常 简单 的 例子 ， 并 在 下 一 章 研 究 更 复杂 的 变 体 。 


2.6.3 输入 和 输出 


前 面 的 示例 片段 和 脚本 已 经 使 用 了 Python 内 置 的 print () 函数 来 输出 结果 。 许 多 程序 设计 
语言 都 提供 了 相同 的 实现 输入 和 输出 的 机 制 ， 为 程序 员 提 供 了 一 个 方便 的 抽象 ， 用 于 将 数据 移 
入 或 移出 计算 机 处 理 器 。 事 实 上 ， 这 些 IO 内 置 函 数 都 是 与 硬件 控制 器 及 上 一 节 讨 论 的 外 围 设备 
进行 通信 的 。 

到 目前 为 止 ， 我 们 的 示例 脚本 还 没有 要 求 用 户 输入 。 简 单 的 用 户 输入 可 以 用 Python 内 置 的 
input () 函数 来 完成 。 

echo = input('Please enter a string to echo: ') 

print (echo * 3) 


input () 函数 把 一 个 可 选 的 提示 字符 串 当 作 参 数 , 在 等 待 输入 时 呈现 给 用 户 。 当 这 个 脚 
本 运行 时 ， 在 显示 完 “Please enter a string to echo:” 这 个 提示 后 ， 脚 本 会 暂停 ， 
等 待 用 户 键入 内 容 。 当 用 户 按 下 回 车 键 时 , 脚本 将 键入 的 字符 组 成 的 字符 串 (不 包括 回 车 键 ) 
赋 给 变量 echo。 接 着 ,脚本 的 第 二 行将 这 个 字符 串 重 复 输 出 3 次 。( 回 顾 : “运算 符 复制 字符 
串 操 作 数 。) 

现在 有 了 获取 输入 的 能 力 ， 让 我 们 重 写 前 面 的 斜 边 脚本 来 提示 用 户 输入 边 长 ， 而 不 是 将 值 
硬 编码 到 赋值 语句 中 。 

# Calculates the hypotenuse of a right triangle 

import math 


# InPutting the side lengths, first try 

sideA = input('Length of side A? ') 

sideB = input ('Length of side B? ') 

# Calculate third side via Pythagorean Theorem 
hypotenuse = math.sqrt (sideA**2 + sideB**2) 


print (hypotenuse) 


运行 时 ， 这 个 脚本 提示 用 户 “Length of side A? ”， 并 等 待 输 入。 假设 用 户 键入 “3” 
并 回 车 。 该 脚本 继续 提示 用 户 “Length of side B? ”， 并 等 待 输入 。 假 设 用 户 键 入 “4” 并 
回 车 。 此 时 ，Python 解 释 器 中 止 脚本 ， 打 印 输出 : 
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hypotenuse = math.sqgrt (sideA**2 + sideB**2) 


TypeError: unsupported operand type(s) for ** or pow(): 'str' and ‘int' 

像 Python 这 样 的 动态 类 型 语言 很 容易 产生 这 种 类 型 的 错误 。 我 们 的 斜 边 计算 在 这 个 脚本 的 
早期 版 本 中 能 正常 工作 ， 现 在 把 值 改 为 由 用 户 输入 后 就 会 导致 错误 。 这 个 问题 实际 是 一 个 
“TypeError” 错 误 ， 这 个 错误 源 于 Python 不 再 知道 如 何 获 取 变 量 sideA 的 平方 这 一 事实 ， 因 为 
现在 这 个 脚本 中 的 sideA 是 一 个 字符 串 ， 而 不 是 之 前 那样 的 整数 。 这 个 问题 不 是 在 这 个 脚本 中 
计算 斜 边 的 那 一 行 产 生 的 ， 而 是 在 前 面 input () 返回 sideA 和 sideB 的 值 时 产生 的 。 这 个 问题 
也 是 使 用 程序 设计 语言 出 错时 常见 的 问题 。Python 解 释 器 试图 提供 这 个 程序 出 错 的 脚本 行 ， 但 
真正 导致 出 错 的 行 实际 上 在 这 行 脚本 的 前 面 。 

在 字符 串 中 回 送 上 面 的 片段 ， 很 明显 ， 赋 给 echo 的 值 应 该 是 用 户 键入 的 字符 串 。 虽 然 程序 
员 的 目的 现在 是 输入 整数 值 ， 但 input () 函数 的 行为 方式 还 和 和 斜 边 程序 中 的 一 样 。 字 符 串 “4” 
的 ASCII 或 UTF-8 编 码 表示 与 整数 4 的 二 进 制 表示 不 同 , 在 使 用 整数 继续 进行 计算 之 前 , 该 Python 
脚本 必须 显 式 地 进行 从 一 种 表示 到 另 一 种 表示 的 转换 。 

幸运 的 是 ， 另 一 个 内 置 函 数 提 供 了 这 种 功能 。int () 函数 会 尝试 将 其 参数 转换 为 整数 表示 。 
如 果 无 法 转换 ， 会 产生 相应 的 错误 信息 。 

在 这 个 脚本 中 ， 至 少 有 3 个 地 方 可 以 使 用 int () 函数 修正 bug。 我 们 甚至 可 以 在 将 input () 
函数 的 结果 赋 给 变量 之 前 就 调用 它 ， 可 以 只 为 转换 函数 的 调用 添加 新 脚本 行 ， 还 可 以 只 在 对 
math.sqrt () 函数 调用 里 的 变量 进行 平方 运算 之 前 进行 转换 。 下 面 这 个 修订 后 的 脚本 使 用 了 第 
一 种 方案 ， 第 二 种 方案 作为 练习 留 给 读者 。 


# Calculates the hypotenuse of a right triangle 
import math 


# Inputting the side lengths, with integer conversion 
sideA = int (input('Length of side A? ')) 

sideB = int(input('Length of side B? ')) 

# Calculate third side via Pythagorean Theorem 
hypotenuse = math.sqrt (sideA**2 + sideB**2) 


print (hypotenuse) 


修订 后 的 脚本 能 按 预 期 运行 ,并且 能 用 于 许多 直角 三 角形 ， 而 无 需 编辑 脚本 ， 就 像 预 输入 
版 本 一 样 。 

最 后 需要 注意 的 一 点 是 ，int () 函数 是 通过 仔细 检查 其 字符 串 参 数 并 将 其 解释 为 数 来 执行 
转换 的 。 如 果 输 入 的 字符 串 是 一 个 数 ， 但 不 是 整数 ， 如 “3.14”， 那 么 int () 函数 会 丢弃 小 数 部 
分 ， 返回 一 个 整数 值 。 这 是 一 个 截断 操作 ， 不 会 像 人 类 期 望 的 那样 “向 上 舍 入 ”。Python 中 所 有 
的 其 他 标准 值 类 型 都 有 相似 的 转换 函数 。 


2.6.4 马拉松 训练 助手 


下 面 这 个 完整 的 Python 脚本 演示 了 本 节 介 绍 的 许多 概念 。 随 着 休闲 长 跑 受 欢迎 程度 的 增加 ， 
许多 参与 者 发 现 自己 在 追求 复杂 的 身体 训练 计划 ， 为 跑马 拉 松 做 准备 。 这 个 脚本 能 根据 跑步 者 
想 跑 的 距离 和 步 速 ， 帮 助跑 步 者 计算 他 需要 多 入 的 训练 性 锻炼 。 给 定 步 速 〈pace， 跑 1 英里 的 分 
钟 和 秒 数 ) 和 总 里 程 ， 该 脚本 计算 跑步 锻炼 的 预计 跑 行 时 间 ， 以 及 一 个 用 户 友 好 的 速度 ， 以 每 
小 时 的 英里 数 为 单位 。 图 2-15 给 出 了 一 些 示例 数据 点 ， 在 每 行 中 ， 前 3 列 是 输入 ， 后 3 列 是 预 
期 的 结果 。 注 意 ， 不 同 的 Python 实 现 输出 的 速度 值 的 小 数 点 后 的 位 数 可 能 跟 图 2-15 中 的 不 同 ， 
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图 2-15 中 的 值 没 有 算出 约 整 数 。 


时 间 每 英里 





图 2-15 马拉松 训练 数据 示例 


# Marathon training assistant. 


import math 


# This function converts a number of minutes and seconds into just seconds. 
def total seconds (min, sec): 


return min * 60 + sec 


# This function calculates a speed in miles per hour given 
# a time (in seconds) to run a single mile. 
def speed (time): 

return 3600 / time 


# Prompt user for pace and mileage. 
pace minutes = int(input('Minutes Per mile? ')) 
pace seconds = int(input('Seconds per mile? ')) 
miles = int(input('Total miles? ')) 


# Calculate and- print speed. 
mph = speed(total seconds (pace minutes, pace seconds)) 
print('Your Speed is') 


print (mph) 


# Calculate elapsed time for planned workout. 

total = miles * total seconds (pace minutes, pace seconds) 
elapsed minutes = total // 60 

total % 60 


中 


elapsed seconds 


print('Your total elapsed time is') 
print (elapsed minutes) 


print (elapsed seconds) 


上 面 的 脚本 既 使 用 了 内 置 函数 input ()、int () 和 print ()，, 又 使 用 了 用 户 定义 的 函数 speed () 
和 total seconds () 。 关 键 字 def 的 后 面 是 用 户 函 数 定义 ， 再 后 面 是 函数 调用 时 要 提供 的 函数 
名 称 和 参数 列表 。 接 下 来 的 缩 进行 称 为 函数 体 (body)， 表 示 的 是 定义 该 函数 的 步骤 。 在 后 面 的 
章节 中 ,我 们 会 看 到 一 些 函 数 体内 包含 多 条 语句 的 函数 示例 。 关 键 字 return 突 出 显示 了 用 于 计 
算 该 函数 结果 的 表达 式 。 
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虽然 用 户 定义 的 函数 都 是 在 脚本 的 顶部 定义 的 ， 但 实际 上 并 没有 在 项 部 被 调用 ， 而 是 在 后 


面 的 脚本 中 作为 一 个 较 大 表达 式 的 一 部 分 被 调用 的 。 另外 还 请 注意 这 个 脚本 堆 县 函数 调用 的 方 


式 。 


input () 函数 的 调用 结果 被 立即 当 作 参数 传递 给 int () 函数 ， 然 后 int () 函数 的 结果 被 赋 


值 给 一 个 变量 。 同 样 ，total_seconds () 函数 的 结果 也 被 立即 当 作 参数 传递 给 speed () 函数 ， 
speed () 函数 的 结果 然后 又 被 赋值 给 变量 mph。 在 这 两 种 情况 下 ， 都 允许 一 次 调用 一 个 函数 ， 
将 结果 赋值 给 新 变量 ， 然 后 调用 下 一 个 依赖 头 一 个 结果 的 函数 。 然 而 ， 这 种 更 紧凑 的 形式 更 简 


洁 ， 


30 


不 需要 增加 临时 变量 来 存储 计算 的 中 间 结 果 。 
给 定 输入 每 英里 7 分 45 秒 ， 跑 6 英里 ， 该 脚本 输出 ; 
Your SpeedQ is 

7.74193548387 

Your total elapsed time is 

46 

30 


此 输出 的 格式 仍然 相当 原始 。 它 缺乏 适当 的 单位 (7.74193548387 mph 和 46 minutes、 
seconds )， 对 于 一 个 简单 计算 来 讲 ， 这 个 输出 值 的 小 数位 数 不 合 适 ， 而 且 整 个 输出 结果 有 


太 多 断 行 。 更 清晰 的 输出 作为 练习 留 给 读者 。 


问题 与 练习 


tt 一 


0 


家 


> 


. 斜 边 示例 脚本 将 两 个 边 长 截断 为 整数 ， 但 输出 却 为 浮 点 数 ， 为 什么 ? 改写 这 个 脚本 ， 使 其 输出 


整数 。 
改写 斜 边 脚本 ， 使 用 浮 点 数 作为 输入 ， 不 截断 它们 。 前 一 个 问题 里 的 整数 版 本 和 这 个 问题 里 的 浮 点 
数 版 本 ， 哪 个 更 合适 ? 


. Python 内 置 函 数 stz () 能 把 一 个 数值 参数 转换 为 一 个 字符 串 表 示 ，'+ "可 以 用 于 将 字符 串 连接 在 一 起 。 


使 用 这 些 修 改 马 拉 松 脚本 ， 产 生 更 清晰 的 输出 ， 例 如 : 


Your speed is 7.74193548387 mph 
Your total elapsed time is 46 minutes, 30 seconds 


. 使 用 Python 内 置 的 pin () 函数 写 一 个 脚本 , 读 取 一 个 十 进 制 整数 作为 输入 ,用 1 和 0 输出 这 个 整数 对 应 


的 二 进 制 表示 。 


. XOR 运 算 常常 用 于 高 效 地 计算 校 验 和 ( 见 1.9 节 ) 和 加 密 《〈 见 4.5 节 )。 写 一 个 简单 的 Python 脚本 ， 读 取 


一 个 数字 ， 输 出 这 个 数字 与 一 个 1、0 模 式 进行 XOR 运 算 的 结果 ， 如 0x55555555。 同 样 的 脚本 将 把 一 
个 数字 “加 密 ” 为 一 个 看 似 不 相关 的 数字 ,但 当 再 次 运行 时 ,给 定 这 个 加 密 数 字 当 作 输 入 将 返回 原来 
的 数字 。 


. 通过 为 本 节 的 示例 脚本 提供 一 些 意外 的 输入 ， 创 造 一 些 错误 ， 研 究 这 些 错误 条 件 。 如 果 你 在 斜 边 肢 


本 或 马拉松 脚本 中 输入 全 0 会 怎么 样 ? 负数 呢 ? 用 字符 串 代 替 数 值 呢 ? 


*2.7 ”其 他 体系 结构 


= 一 一 -一 = 一 一 一 -一 一 一 一 





为 了 拓宽 视角 ， 我 们 来 考虑 一 些 已 经 讨论 过 的 传统 计算 机 体系 结构 的 替代 方案 。 


2.7.1 ”流水 线 


电子 脉冲 在 电线 上 传播 的 速度 比 光 速 慢 。 光 大 约 每 纳 秒 〈 十 亿 分 之 一 秒 ，ns) 能 传播 1 英尺 
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的 距离 ,然而 CPU 中 的 控制 单元 至 少 需要 2 ns 才能 从 1 英尺 之 外 的 存储 单元 中 读 取 到 指令 。( 读 请 
求 必须 发 送 到 存储 器 ， 这 人 至少 需要 1 ns， 而 指令 又 必须 送 回 CPU， 这 至 少 也 需要 1 ns。) 因此， 
在 这 样 的 机 器 中 取 指 和 执行 一 条 指令 需要 若干 纳 秒 一 一 这 就 意味 着 提高 机 器 执行 速度 的 问题 最 
终 将 变 成 小 型 化 问题 。 

然而 ， 提 高 执行 速度 并 不 是 改进 计算 机 性 能 的 唯一 途径 。 真 正 目的 是 改进 机 器 的 吞吐 量 
(throughput) 一 一 机 器 在 给 定时 间 内 可 以 完成 的 工作 总 量 。 

在 不 要 求 提 高 执行 速度 的 前 提 下 ， 增 加 计算 机 吞吐 量 的 一 个 例子 涉及 流水 线 (pipelining) 
技术 ， 该 技术 允许 一 个 机 器 周期 内 的 各 个 步骤 重 登 进行 。 特 别 是 ， 当 执行 一 条 指令 时 ， 可 以 取 
下 一 条 指令 ， 这 也 就 意味 着 在 任何 一 个 时 刻 可 以 有 不 止 一 条 指令 在 “流水 线 ” 上 ， 每 条 指令 处 
在 不 同 的 处 理 阶段 。 这 样 ， 尽 管 读 取 和 执行 每 条 指令 的 时 间 保 持 不 变 ， 机 器 的 总 吞吐 量 却 提高 
了 。 (当然 ， 当 到 达 JUMP 指 令 时 ， 不 会 实现 预 取 指 令 来 提高 效率 的 效果 ， 因 为 “流水 线 ” 上 的 
指令 不 是 所 需要 的 。) 

现代 机 器 设计 已 使 得 流水 线 思 想 大 大 超越 了 我 们 所 举 的 例子 。 它 们 经 常 能 够 同时 读 取 若 干 
条 指令 ， 并 且 一 次 可 以 执行 多 条 彼此 互 不 依赖 的 指令 。 





科技 进步 使 得 一 个 硅 片 上 可 以 放置 越 来 越 多 的 电路 ， 以 致 计算 机 部 件 之 间 的 物理 差别 逐 
渐变 小 。 例如， 单个 芯片 就 可 以 包括 CPU 和 主 存储 器 。 这 是 “片上 系统 ”( system-on-a-chip， 
SoC ) 方法 的 一 个 例子 ， 目 的 是 在 单个 设备 中 提供 一 个 完整 的 系统 ， 使 得 其 可 在 更 高 的 设计 
层面 被 用 作 一 个 抽象 工具 。 在 其 他 情况 下 ， 单 个 设备 中 还 包含 相同 电路 的 多 个 复制 品 。 它 最 
初 的 形式 是 包含 若干 独立 门 或 者 多 重 触发 器 的 芯片 。 在 现在 的 技术 条 件 下 ， 单 个 芯片 可 以 存 
放 不 止 一 个 完整 的 CPU。 这 就 是 多 核 CPU 设备 的 基础 体系 结构 : 在 同一 芯片 上 存在 两 个 或 更 多 
CPU 以 及 共用 的 高 速 缓冲 存储 器 。( 包含 两 个 处 理 单元 的 多 核 CPU 通 常 被 称 作 双核 CPU. ) 这 种 
设备 简化 了 MIMD 系 统 的 构建 ， 并 已 被 迅速 应 用 于 家 用 计算 机 。 


2.7.2 ”多 处 理 器 机 器 


可 以 把 流水 线 技术 看 作 迈 向 并 行 处 理 (parallel processing) 的 第 一 步 ， 并 行 处 理 是 若干 活动 
在 同一 时 间 里 实现 的 性 能 。 然 而 ， 真 正 的 并 行 处 理 需 要 多 个 处 理 单元 ， 于 是 产生 了 称 为 多 处 理 
器 或 者 多 核 (multi-core) 机 器 的 计算 机 。 

当今 大 多 数 计算 机 的 设计 都 基于 这 种 思想 。 一 个 策略 是 将 若干 处 理 单元 〈 每 一 个 都 像 单 处 
理 器 机 器 中 的 CPU) 都 连接 到 同一 个 主 存储 器 上 。 在 这 样 的 配置 下， 各 处 理 器 可 以 独立 工作 ， 
并 通过 把 相关 的 信息 放 在 公共 存储 单元 里 来 协调 各 目的 工作 。 例 如 ， 当 某 个 处 理 器 遇 到 一 个 大 
任务 时 ， 它 可 以 将 部 分 任务 的 程序 存储 在 这 个 公共 存储 器 中 ， 然 后 请 求 另 一 个 处 理 器 执行 它 。 
结果 产生 这 样 的 计算 机 : 不 同 的 指令 序列 在 不 同 的 数据 集 上 操作 ， 相 对 于 较 传 统 的 单 指令 流 单 
数据 流 (single-instruction stream，single-data stream，SISD) 体系 结构 ， 它 被 称 为 多 指令 流 多 数 
据 流 (multiple-instruction stream，multiple-data stream，MIMD ) 体系 结构 。 

多 处 理 器 体系 结构 的 一 个 变 体 是 将 多 个 处 理 器 链接 起 来 ， 使 得 它们 一 起 执行 同一 个 指令 序 
列 ， 每 个 处 理 器 都 有 各 自 的 数据 集 。 这 就 产生 了 单 指令 流 多 数据 流 (single-instruction stream， 
multiple-data stream，SIMD) 体系 结构 。 这 种 机 器 适用 于 这 样 的 应 用 : 在 一 大 堆 数 据 中 ， 对 于 
其 中 每 组 类 似 的 数据 项 都 要 执行 同样 的 任务 。 并 行 处 理 的 另外 一 种 方法 是 将 许多 小 型 机 器 聚集 
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成 为 大 的 计算 机 ， 每 台 机 器 都 有 自己 的 存储 器 和 CPU。 这 样 ， 每 台 小 型 机 器 都 与 它 的 邻居 们 相 
连接 ， 使 得 赋予 整个 系统 的 任务 可 以 分 割 到 各 台 小 机 器 上 实现 。 因 此 ， 如 果 分 配给 某 台 内 部 机 
器 的 一 项 任务 可 以 分 割 为 若干 独立 的 子 任务 ， 那 么 这 人 台 内 部 机 器 可 以 请 求 它 的 邻居 们 并 发 地 完 
成 各 个 子 任务 。 这 样 ， 完 成 任务 的 时 间 可 以 比 由 一 台 单 处 理 器 机 器 独立 完成 任务 所 需要 的 时 间 
少 得 多 。 


问题 与 练习 

1 回 到 2.3 节 问题 3， 如 果 该 机 器 使 用 本 书 讨论 的 流水 线 技术 ， 当 地 址 为 AA 的 指令 被 执行 时 ,“ 流 水 线 ” 

“里 有 什么 ? 在 什么 条 件 下 ， 该 程序 不 会 从 流水 线 技术 得 到 好 处 ? 

2. 在 一 台 流水 线 机 器 上 运行 2.3 节 问题 4 中 的 程序 时 ， 必 须要 解决 什么 冲突 ? 

3. 假设 有 两 个 “中 央 ” 处 理 器 连接 到 同一 个 存储 器 上 ， 但 执行 不 同 的 程序 ， 再 假设 ， 其 中 一 个 处 理 器 
需要 给 一 个 存储 单元 的 内 容 加 1， 几 乎 同时 ， 另 外 一 个 处 理 器 需要 给 同一 个 存储 单元 的 内 容 减 1。( 净 
效果 应 该 是 该 存储 单元 最 终 保持 开始 时 的 值 。) 

”a. 描述 一 个 执行 序列 ， 其 结果 为 该 单元 最 终 数值 比 开 始 值 少 1。 

bb. 描述 一 个 执行 序列 ， 其 结果 为 该 单元 最 终 数值 比 开始 值 大 1。 


一 一 一 = 一 -一 -一 一 一 一 一 一 < 一 - 一 一 一 - 





复习 题 
〈 带 * 的 题目 涉及 选读 章节 的 内 容 。) 假定 该 程序 计数 器 初始 值 为 00, 请 记录 该 程序 
1. a. 在 什么 情况 下 ， 通 用 寄存 器 和 主 存储 单元 执行 到 机 器 停止 这 一 过 程 中 在 每 个 机 器 周期 
类 似 ? 取 指 阶段 末尾 , 程序 计数 器 、 指 令 寄 存 器 以 及 
b. 在 什么 情况 下 ， 通 用 寄存 器 和 主 存储 单元 地 址 为 02 的 存储 单元 的 内 容 。 
不 同 ? 6. 假设 3 个 值 -、y、z 存 储 在 机 器 的 存储 器 中 。 描 
2. 根据 附录 C 描 述 的 机 器 语言 回答 下 列 问题 。 述 在 计算 x +y+ z 时 发 生 的 事件 序列 《如 从 存 
a. 将 指令 2304〈 十 六 进 制 ) 写成 16 位 位 串 。 储 器 装 入 寄存 器 ， 将 值 保 存在 存储 器 中 ， 等 
b. 将 指令 B2A5 十 六 进 制 ) 的 操作 码 写 成 4 等 )。 计 算 (2x)+ y 时 又 如 何 呢 ? 
位 位 串 。 7. 下 面 是 用 附录 C 描 述 的 机 器 语言 编写 的 指令 。 
c. 将 指令 B2A5《〈 十 六 进 制 ) 的 操作 数字 段 写 把 它 翻译 成 为 自然 语言 。 
成 12 位 位 串 。 a.7123 b. 40E1 c.A304 
3. 假设 在 附录 C 描 述 的 机 器 里 一 个 数据 块 存 储 在 d.B100 e.2BCD 
地 址 从 98 到 A2( 含 ) 的 存储 单元 中 。 这 一 数据 8. 假设 有 一 机 器 语言 , 指令 的 操作 码 字 段 为 4 位 。 
块 占据 多 少 存储 单元 ? 列 出 它们 的 地 址 。 那么 该 语言 可 以 有 多 少 种 不 同 的 指令 ? 如 果 
4. 在 附录 C 描 述 的 机 器 里 ， 刚 执行 完 指 令 BOCD 操作 码 字段 增加 到 6 位 呢 ? 
后 程序 计数 器 的 值 是 多 少 ? 9. 将 下 列 指令 由 自然 语言 翻译 为 附录 C 描 述 的 
5. 假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 05 的 机 器 语言 。 
存储 单元 中 包含 下 列 位 模式 。 a. 将 十 六 进 制 值 77 加 载 (LOAD) 到 寄存 器 
Ce 
Tt b. 将 存储 单元 77 的 内 容 加 载 到 寄存 器 7。 
页 引 c. 如 果 寄 存 器 0 的 内 容 与 寄存 器 A 的 值 相 同 ， 则 
02 32 转移 (JUMP) 到 存储 器 位 置 为 24 的 指令 。 
03 02 d. 将 寄存 器 4 循环 右 移 (ROTATE) 3 位 。 
04 co e. 对 寄存 器 E 和 2 的 内 容 进 行 AND 运 算 ， 结 果 


05 00 存在 寄存 器 1 中 。 
10. 重 写 图 2-7 中 的 程序 ， 假 定 相 加 的 数值 用 浮 点 


js 
pt 


记 数 法 编码 ， 而 不 是 二 进 制 补 码 记 数 法 。 


. 下 面 是 用 附录 C 描 述 的 机 器 语言 编写 的 指令 。 


请 按照 它们 的 执行 是 否 改变 位 置 为 3B 的 存储 
单元 的 值 、 是 否 读 取 位 置 为 3C 的 存储 单元 的 
内 容 、 是 否 与 位 置 为 3C 的 存储 单元 的 内 容 没 


有 关系 进行 分 类 。 
a. 353C b. 253C c. 153C 
d.3C3C e. 403C 


. 假设 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 03 的 存 


储 单元 中 包含 下 列 位 模式 。 


地 址 内 容 
00 26 
01 55 
02 C0 
03 00 


a. 将 第 一 条 指令 翻译 为 自然 语言 。 
b. 如 果 机 器 在 程序 计数 器 的 值 为 00 时 启动 ， 
那么 机 器 停止 时 寄存 器 6 中 是 什么 位 模式 ? 


. 假设 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 02 的 存 


储 单元 中 包含 下 列 位 模式 。 
地 址 内 容 
00 12 
01 2 
02 34 


a. 如 果 机 器 在 程序 计数 器 值 为 00 时 启动 ， 执 
行 的 第 一 条 指令 会 是 什么 ? 

b. 如 果 机 器 在 程序 计数 器 值 为 01 时 启动 ， 执 
行 的 第 一 条 指令 会 是 什么 ? 


. 假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 05 的 


存储 单元 中 包含 下 面 的 位 模式 。 


地 址 内 容 
00 12 
01 02 
02 32 
03 42 
04 C0 
05 00 


假设 机 器 在 程序 计数 器 的 值 为 00 时 启动 , 回答 
下 面 的 问题 。 

a. 将 要 执行 的 指令 翻译 成 自然 语言 。 

b. 当 机 器 停止 时 ， 地 址 为 42 的 存储 单元 中 是 
什么 位 模式 ? 

c. 当 机 器 停止 时 ， 程 序 计数 器 中 是 什么 位 
模式 ? 


ES; 
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假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 09 的 


存储 单元 中 包含 下 列 位 模式 。 
地 址 内 容 

i 
01 03 
02 2B 
03 03 
04 5A 
05 BC 
06 3A 
07 00 
08 C0 
09 00 


假设 机 器 在 程序 计数 器 的 值 为 00 时 启动 ， 回 答 

下 列 问题 。 

a. 当 机 器 停止 时 ， 地 址 为 00 的 存储 单元 里 有 
什么 ? 

b. 当 机 器 停止 时 ， 程 序 计数 器 中 会 是 什么 位 
模式 ? 


. 假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 07 


的 存储 单元 中 包含 下 列 位 模式 。 

地 址 内 容 
”一 
ol 07 
02 3B 
03 06 
04 co 
05 00 
06 00 
07 23 


a. 假设 机 器 在 程序 计数 器 的 值 为 00 时 启动 ， 
请 列 出 包含 待 执行 程序 的 存储 单元 的 地 址 。 
b. 列 出 用 于 存储 数据 的 存储 单元 的 地 址 。 


. 假设 在 附录 C 描 述 的 机 器 里 , 从 地 址 00 到 0D 的 


存储 单元 中 包含 下 列 位 模式 。 
地 址 内 客 
00 20 
01 04 
02 21 
03 01 
04 40 
05 12 
06 51 
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续 表 
地 址 内 容 

07 12 

08 Bl 

09 0C 

0A B0 

0B 06 

0C C0 

0D 00 
假设 机 器 在 程序 计数 器 的 值 为 00 时 启动 。 


20. 


a. 当 机 器 停止 时 ,寄存 器 0 中 是 什么 位 模式 ? 

b. 当 机 器 停止 时 ， 寄 存 器 1 中 是 什么 位 模式 ? 

c. 当 机 器 停止 时 ， 程 序 计数 器 中 是 什么 位 
模式 ? 


. 假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 F0 到 FD 


的 存储 单元 中 包含 下 列 〈 十 六 进 制 ) 位 模式 。 


地 址 内 容 
FO 20 
Fl 00 
F2 22 
F3 01 
F4 23 
E53 04 
F6 B3 
F7 FC 
F8 50 
F9 02 
FA B0 
FB F6 
FC C0 
FD 00 


如 果 机 器 在 程序 计数 器 的 值 为 FO 时 启动 ， 那 
么 当 机 器 最 终 执行 到 地 址 为 FC 的 停机 指令 
时 ， 寄 存 器 0 中 的 值 是 什么 ? 


. 如 果 附 录 C 描 述 的 机 器 每 微 秒 〈 百 万 分 之 一 


秒 ) 执行 一 条 指令 , 那么 完成 问题 18 中 的 程序 
需 用 时 多 少 ? 


假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 20 到 28 的 
存储 单元 中 包含 下 列 位 模式 。 
地 址 内 容 
20 12 
21 20 
22 32 
23 30 


24 B0 


地 址 内 容 
25 21 
26 24 
27 C0 
28 00 


假设 机 器 在 程序 计数 器 的 值 为 20 时 启动 。 

a, 当 机 器 停止 时 ， 寄 存 嚣 0、1 和 2 中 是 什么 位 
模式 ? 

b. 当 机 器 停止 时 ， 地 址 为 30 的 存储 单元 中 是 
什么 位 模式 ? 

c. 当 机 器 停止 时 ， 地 址 为 B0 的 存储 单元 中 是 
什么 位 模式 ? 


21. 假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 AF 到 B1 


22. 


23. 


24. 


liD 


by) 


心 





的 存储 单元 中 包含 下 列 位 模式 。 
和 
AF B0 
B0 B0 
Bl AF 


如 果 机 器 在 程序 计数 器 的 值 为 AF 时 启动 ， 那 
么 会 发 生 什么 ? 

假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 05 的 
存储 单元 中 包含 下 列 〈 十 六 进 制 ) 位 模式 。 


地 址 内 容 
00 25 
01 B0 
02 35 
03 04 
04 C0 
05 00 


如 果 机 器 在 程序 计数 器 的 值 为 00 时 启动 , 那么 

机 器 在 什么 时 候 会 停止 ? 

对 于 下 面 每 种 情况 ， 用 附录 C 描 述 的 机 器 语言 

编写 一 个 小 程序 来 完成 以 下 任务 。 假 定 每 个 程 

序 都 放 在 从 地 址 00 开 始 的 存储 器 里 。 

a. 将 存储 器 位 置 D8 的 值 移动 到 存储 单元 B3。 

b. 交换 存储 器 位 置 D8 和 B3 中 的 值 。 

c. 如 果 存 储 器 位 置 44 中 存储 的 值 是 00， 则 将 
值 01 存 放 在 存储 器 位 置 46 中 ; 和 否则， 将 值 
FF 存放 在 存储 器 位 置 46 中 。 

在 计算 机 爱好 者 中 曾经 流行 一 种 叫 磁 芯 大 战 

(Core Wars) 的 游戏 一 一 战舰 游戏 的 变 体 。 

(术语 磁 芯 来 源 于 早期 的 一 种 存储 技术 , 它 用 


23, 


26. 


2 


28. 


磁 材 料 的 小 环 的 磁场 方向 表示 0 和 1。 小 环 称 

为 磁 芯 。) 这 个 游戏 是 在 两 个 对 立 的 程序 之 间 

玩 的 ， 每 个 程序 分 别 存 储 在 同一 台 计 算 机 的 

存储 器 的 不 同位 置 里 。 假 设 该 计算 机 轮流 执 

行 这 两 个 程序 , 先 执行 一 个 程序 的 一 条 指令 ， 

再 执行 另 一 个 程序 的 一 条 指令 。 每 个 程序 的 

目标 是 通过 把 额外 数据 写 到 另外 一 个 程序 上 

来 破坏 对 立 程序 ， 不 过 ， 哪 个 程序 都 不 知道 

对 方 的 位 置 。 

. 用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 , 采 

用 防卫 的 方式 ， 以 最 小 的 代价 玩 此 游戏 。 

用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 ， 通 

过 不 断 变 动 自己 的 位 置 来 避免 受到 对 立 程 

序 的 袭击 。 更 确切 地 说 ， 从 位 置 00 开 始 ， 

编写 一 个 程序 ， 将 自身 复制 到 位 置 70， 再 

转移 到 位 置 70。 

c. 扩展 (b) 中 的 程序 ， 继 续 重 定位 到 新 的 
存储 器 位 置 。 具 体 来 说 ， 先 让 程序 移 至 位 
置 70， 然 后 移 到 E0 (=70+70)， 再 移 到 60 
(=70+70+70)， 等 等 。 

用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 ， 计算 

存放 在 存储 单元 A0、Al1、A2、A3 中 的 浮 点 数 

的 和 ， 并 将 结果 存 入 存储 器 位 置 A4 中 。 

假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 05 的 

存储 单元 中 包含 下 列 〈 十 六 进 制 ) 位 模式 。 


DD 


各 


地 址 内 容 
00 20 
01 C0 
02 30 
03 04 
04 00 
05 00 


如 果 机 器 在 程序 计数 器 的 值 为 00 时 启动 ， 会 发 
生 什么 ? 

如 果 在 附录 C 描 述 的 机 器 里 ， 地 址 为 08 和 09 的 
存储 单元 中 分 别 包含 位 模式 BO 和 08， 并 且 机 
器 启动 时 程序 计数 器 中 包含 值 08, 那么 会 发 生 
什么 ? 

假设 下 列 用 附录 C 中 描述 的 机 器 语言 编写 
的 程序 存储 在 从 地 址 30〈 十 六 进 制 ) 开始 
的 主 存储 器 中 。 当 执 行 该 程序 时 它 会 完成 什 
么 任务 ? 

2003 

2101 


2 
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复习 题 87 
2200 
2310 
1400 
3410 
5221 
5331 
3239 
333B 
B248 
B038 
C000 


概述 当 附 录 C 描 述 的 机 器 执行 一 条 操作 码 为 B 
的 指令 时 所 涉及 的 步骤 。 用 一 组 说 明 来 表示 你 
的 答案 ， 就 像 你 在 告诉 CPU 做 什么 。 


. 概述 当 附 录 C 描 述 的 机 器 执行 一 条 操作 码 为 5 


的 指令 时 所 涉及 的 步骤 。 用 一 组 说 明 来 表示 你 
的 答案 ， 就 像 你 在 告诉 CPU 做 什么 。 


. 概述 当 附 录 C 描 述 的 机 器 执行 一 条 操作 码 为 6 


的 指令 时 所 涉及 的 步骤 。 用 一 组 说 明 来 表示 你 
的 答案 ， 就 像 你 在 告诉 CPU 做 什么 。 


. 假设 在 附录 C 描 述 的 机 器 里 ， 寄 存 器 4 和 5 中 分 


别 包 括 位 模式 3A 和 C8， 在 执行 下 列 每 条 指令 
后 ， 寄 存 器 0 中 会 留 下 什么 位 模式 ? 

a. 5045 b. 6045 c. 7045 

d. 8045 e. 9045 


. 利用 附录 C 描 述 的 机 器 语言 ， 为 完成 下 面 每 个 


任务 分 别 编写 一 个 程序 。 

a. 将 存储 器 位 置 44 中 存储 的 位 模式 复制 到 存 

储 器 位 置 AA 中 。 

将 存储 器 位 置 34 中 的 最 低 有 效 4 位 变 成 0， 

并 保持 其 他 位 不 变 。 

. 将 存储 器 位 置 A5 中 的 最 低 有 效 4 位 复制 到 
存储 器 位 置 A6 中 的 最 低 有 效 4 位 , 并 保持 A6 
中 的 其 他 位 不 变 。 

. 将 存储 器 位 置 A5 中 的 最 低 有 效 4 位 复制 到 
存储 器 位 置 A5 中 的 最 高 有 效 4 位 。( 于 是 ， 
A5 中 的 前 4 位 将 和 后 4 位 相同 。) 


FT 


© 


[= 


*34. 完成 下 列 运算 。 


a LLO0L Bb; 000101 
RND 101001 AND 101010 
Cs 001110 d. 111011 
AND 010101 AND 110111 
e@. 11 Tt 让 010100 
OR 101001 OR 101010 
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g. 000100 h. 101010 
OR 010101 OR 110101 
人 111001 让 000111 
XOR 101001 XOR 101010 
k. 010000 上 于 生计 守 二 
XOR 010101 XOR L101L0Y 
“35. 为 了 完成 下 面 的 任务 ,确定 所 需要 的 掩 码 和 由 


"36 


9 


*38, 


*39., 


*4 


So 


*41. 


*42. 


辑 运算 。 

a. 将 一 个 8 位 位 模式 的 高 4 位 置 1， 并 且 不 影响 
其 他 位 。 

. 将 一 个 8 位 位 模式 最 高 有 效 位 取 反 ， 并 且 不 
影响 其 他 位 。 

. 将 一 个 8 位 位 模式 取 反 。 

将 一 个 8 位 位 模式 的 最 低 有 效 位 置 0。 并 且 

不 影响 其 他 位 。 

将 一 个 8 位 位 模式 除 最 高 有 效 位 外 的 所 有 
位 都 置 1， 并 且 不 改变 最 高 有 效 位 。 

过 滤 掉 一 个 RGB 位 图 图 像 像 素 中 的 所 有 绿 
色 部 分 ， 其 中 24 位 模式 的 中 间 8 位 存储 的 是 
绿色 信息 。 

反 转 一 个 24 位 RGB 位 图 像素 中 的 所 有 位 。 

,将 一 个 24 位 RGB 位 图 像素 中 的 所 有 位 设置 
为 1， 表 示 “ 白 ” 色 。 

编写 并 测试 几 个 小 Python 脚本 ， 实现 前 一 个 问 
题 中 的 每 个 小 问题 。 

确定 一 个 逻辑 运算 (以 及 相应 的 掩 码 )， 使 得 
当 其 用 于 一 个 8 位 的 输入 串 时 ， 当 且 仅 当 输 入 
串 为 10000001 时 ， 产生 的 输出 为 全 0 位 串 。 
编写 并 测试 一 个 小 Python 脚本 ， 实现 前 一 个 
问题 。 

描述 一 组 逻辑 运算 ( 以 及 它们 相应 的 掩 码 )， 
使 得 当 其 用 于 一 个 8 位 的 输入 串 时 ， 当 这 个 输 
入 串 的 最 高 位 和 最 低位 都 是 1 时 输出 结果 为 全 

0 位 串 ， 否 则 输出 中 至 少 应 包含 一 个 1。 


[= 


[= 


0 


mh 


Ea 


; 编写 并 测试 一 个 小 Python 脚 本 ， 实现 前 一 个 


问题 。 

对 下 列 位 模式 执行 循环 左 移 4 位 后 ， 结 果 如 何 ? 
a. 10101 b. 11110000 Cc.001 

d. 101000 e. 00001 


下 列 字 节 用 十 六 进 制 记 数 法 表示 , 对 其 执行 特 
环 右 移 2 位 后 ， 结 果 如 何 ? (用 十 六 进 制 记 数 


法 写 出 答案 。) 
a. 3F b. 0D 
c.FF d.77 


“43. a. 在 附录 C 描 述 的 机 器 语言 中 , 用 什么 样 的 单 


*44. 


*4 


*4 


*4 


*48. 


*49. 


*5 


5 
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个 指令 可 以 完成 寄存 器 B 循 环 右 移 5 位 ? 

b. 在 附录 C 描 述 的 机 器 语言 中 , 用 什么 样 的 单 
个 指令 可 以 完成 寄存 器 B 循 环 左 移 2 位 ? 
用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 ,把 地 
址 为 8C 的 存储 单元 的 内 容 颠 倒 过 来 。( 也 就 是 
说 ， 对 于 地 址 8C 最 后 的 位 模式 ， 从 左 向 右 读 

取 与 最 初 从 右 向 左 读 取 一 致 。) 


. 用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 ， 将 


地 址 A2 中 存储 的 值 减 去 Al 中 存储 的 值 ， 并 将 
结果 存 于 地 址 A0 中 。 假 定 值 用 二 进 制 补 码 记 
数 法 编码 。 


. 高 清 视频 可 以 以 30 帧 每 秒 (fps) 的 速率 传输 ， 


其 中 每 一 帧 的 分 辩 率 为 1920X 1080 像 素 ， 每 
像素 使 用 24 位 。 这 种 格式 的 无 压缩 视频 流 可 
以 通过 USB 1.1 串 行 端口 发 送 吗 ? USB 2.0 串 
行 端口 呢 ? USB 3.0 串 行 端口 呢 ? (注意 ; USB 
1.1、USB 2.0、USB 3.0 串 行 端口 的 最 大 速 
度 分 别 是 12 Mbits、480 Mbiys 和 5 Gbit/s. ) 
假设 某 人 在 键盘 上 每 分 钟 能 打 40 个 单词 。 ( 假 
设 一 个 单词 以 5 个 字符 计 。) 如 果 计 算 机 每 微 秒 
《 百 万 分 之 一 秒 ) 执行 500 条 指令 ,那么 该 计算 
机 在 此 人 打 两 个 连续 的 字符 之 间 可 以 执行 多 
少 条 指令 ? 

对 于 一 个 每 分 钟 打 40 个 单词 的 打字 员 , 键盘 每 
秒 传输 多 少 位 才能 跟 得 上 ? (假定 每 个 字符 以 
ASCI 编 码 ， 每 个 单词 以 6 个 字符 计 。) 

假设 附录 C 中 描述 的 机 器 与 使 用 存储 映射 输 
入 /输出 技术 的 打印 机 通信 ， 同 时 假设 地 址 FF 
用 于 将 字符 发 送 给 打印 机 ， 地 址 FE 用 于 接收 
该 打印 机 的 状态 信息 。 特 别 地 ， 假 设 地 址 FE 
的 最 低 有 效 位 用 于 指示 该 打印 机 是 否 准备 好 
接收 下 一 个 字符 (0 表示 “未 准备 好 ”， 1 表示 
“准备 好 ”)。 从 地 址 00 开 始 ， 编 写 一 个 机 器 语 
言 例 程 ， 它 等 待 打印 机 准备 好 接收 下 一 个 字 
符 ， 然后 把 由 寄存 器 5 中 位 模式 表示 的 字符 发 
送 给 打印 机 。 


. 用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 ， 在 地 


址 从 A0 到 C0 的 所 有 存储 单元 中 存放 0, 但 是 它 
应 该 足够 小 以 致 能 够 存放 在 地 址 从 00 到 13( 十 
六 进 制 ) 的 存储 单元 中 。 


- 假设 某 机 器 硬盘 上 有 200 GB 存储 空间 可 用 ， 以 


15 Mbits 的 速率 从 宽带 上 接收 数据 。 以 这 个 速 
率 ， 需 要 多 久 可 以 存 满 可 用 的 存储 空间 ? 


*52. 假设 某 卫 星系 统 正 以 250 Kbit/s 的 速率 接收 串 
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行 数 据 流 。 如 果 一 个 突 发 的 大 气 干扰 持续 了 理 器 机 器 上 为 何 比 在 一 人 台 单 处 理 器 机 器 上 快 
6.96 秒 ， 那 么 有 多 少数 据 位 会 受到 影响 ? 得 多 ? 

*53. 假设 给 你 32 个 处 理 器 ， 每 个 处 理 器 在 1 秒 内 能 *57. 编写 并 测试 一 个 Python 脚本 , 读 取 一 个 圆 的 浮 
够 完成 两 个 多 位 数字 求 和 运算 100 万 次 。 描 述 点 半径 ， 输 出 这 个 圆 的 周 长 和 面积 。 
如 何 使 用 并 行 处 理 技术 ， 使 得 能 够 在 6x10” *58. 编写 并 测试 一 个 Python 脚本 , 读 取 一 个 字符 串 
秒 的 时 间 内 完成 64 个 数 的 求 和 ,单独 一 个 处 理 和 一 个 整数 ， 输 出 将 这 个 字符 串 重复 给 定 的 整 
器 完成 相同 的 计算 需要 多 少时 间 ? 数 次 后 得 到 的 结果 。 

*54. 概述 CISC 体 系 结构 和 RISC 体 系 结构 之 间 的 *59. 编写 并 测试 一 个 Python 脚本 ， 读 取 一 个 直角 三 
区 别 。 角形 的 两 个 浮 点 边 长 , 输出 斜 边 长 度 、 周 长 和 

*55. 说 出 两 种 提高 吞吐 量 的 方法 。 面积 。 


*56. 对 于 计算 一 组 数值 的 平均 值 , 说 明 在 一 台 多 处 
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希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 道德 、 社 会 和 法 律 问 题 。 回 答 这 些 
问题 不 是 唯一 的 目的 , 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 


1 . 


2. 


人 


假设 某 计 算 机 生产 商 开 发 了 一 种 新 型 的 机 器 体系 结构 。 该 公司 在 多 大 程度 上 可 以 拥有 该 
体系 结构 的 所 有 权 ? 什么 样 的 政策 对 社会 最 好 ? 

从 某 种 意义 上 说 ，1923 年 是 现今 被 许多 人 称 为 有 计划 淘汰 (planned obsolescence) 现象 
诞生 的 时 间 。 这 一 年 ， 由 阿尔 弗 雷 德 。 斯 隆 (Alfred Sloan) 领导 的 通用 汽车 公司 将 汽车 
工业 引 向 了 型 号 概念 的 年 代 。 其 思想 是 通过 改变 风格 ， 而 不 是 必须 推出 更 好 的 车 来 提高 
销售 。 引 用 斯 隆 的 一 句 话 :“ 我 们 希望 你 们 对 自己 现在 的 车 不 满意 ， 于 是 你 们 将 会 购买 
新 车 。” 如 今 ， 计 算 机 行业 在 多 大 程度 上 使 用 了 这 种 市 场 策 略 ? 


. 我 们 常常 在 想 ， 计 算 机 技术 如 何 改 变 了 我 们 的 社会 。 不 过 ,许多 人 争辩 说 ， 这 门 技 术 常 


常 抑制 改变 的 产生 ， 它 试图 使 老 系 统 继续 存在 ， 甚 至 使 其 地 位 更 加 牢固 。 例 如 ， 如 果 没 
有 计算 机 技术 ， 中 央 政 府 在 社会 中 的 角色 会 继续 存在 吗 ? 如 果 没 有 计算 机 技术 ， 中 央 集 
权 在 今天 能 够 达到 什么 程度 ? 如 果 没 有 计算 机 技术 ， 我 们 在 多 大 程度 上 会 更 好 或 更 坏 ? 


. 如 果 某 人 认为 自己 不 需要 知道 机 器 的 任何 内 部 细节 ， 因 为 有 其 他 人 会 建造 它 ， 维 护 它 ， 


并 解决 可 能 发 生 的 问题 , 这 种 想法 合理 吗 ? 你 的 答案 会 因 这 个 机 器 具体 是 计算 机 、 汽 车 、 
核电 三 还 是 烤 面 包机 而 不 同 吗 ? 


. 假设 一 家 厂商 生产 了 一 种 计算 机 芯片 ， 但 是 后 来 发 现 它 设 计 上 有 一 个 缺陷 。 再 假设 该 生 


产 商 在 接 下 来 的 生产 中 修正 了 这 个 缺陷 ， 但 决定 掩盖 最 初 有 缺陷 这 一 事实 ， 不 回收 已 经 
售 出 的 芯片 , 理由 是 : 已 经 售 出 的 芯片 没有 一 个 在 该 缺陷 会 导致 严重 后 果 的 应 用 中 使 用 。 
有 人 会 因为 该 生产 商 的 决定 受到 伤害 吗 ? 如 果 没 有 人 受到 伤害 ， 而 且 该 决定 避免 了 该 生 
产 商 资金 的 流失 亦 或 者 避免 了 辞退 员工 ， 那 么 该 生产 商 的 决定 正确 吗 ? 


. 技术 进步 有 助 于 治愈 心 脏 病 ， 还 是 会 导致 久 坐 的 生活 习惯 进而 导致 心脏 病 ? 


7. 很 容易 想象 ， 由 于 溢出 和 截断 错误 而 产生 的 算术 差错 可 能 会 导致 金融 或 导航 方面 的 灾 


难 。 对 于 图 像 存储 系统 ， 由 于 丢失 图 像 细 节 (也许 在 勘察 或 医疗 诊断 领域 ) 而 产生 的 错 
误会 有 什么 后 果 ? 


. ARM Holdings 是 一 家 为 各 种 消费 性 电子 设备 设计 处 理 器 的 小 型 公司 。 它 并 不 制造 任何 


处 理 器 ， 而 是 将 其 设计 授权 给 半导体 厂商 (如 高 通 、 三 星 和 德州 仪器 )， 这 些 厂商 为 生 
产 出 的 每 个 部 件 支付 特许 权 使 用 费 。 这 种 商业 模式 将 计算 机 处 理 器 的 高 研发 成 本 分 散 
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到 了 整个 消费 性 电子 市 场 。 现 在 ，95% 以 上 的 移动 电话 〈 不 仅 是 智能 手机 )、40% 以 上 
的 数码 相机 和 25% 的 数字 电视 都 在 使 用 ARM 处 理 器 。 此 外 ，ARM 处 理 器 还 用 于 小 型 笔 
记 本 、MP3 播 放 器 、 游 戏 控制 器 、 电 子 书 阅读 器 、 导 航 系统 等 设备 中 。 鉴 于 此 ， 你 是 
否认 为 该 公司 是 垄断 者 呢 ? 为 什么 是 ? 为 什么 不 是 ?因为 消费 类 设备 在 当今 社会 中 扮 
演 着 越 来 越 重要 的 角色 ， 依 赖 这 样 一 个 鲜 为 人 知 的 公司 好 吗 ? 或 者 ， 是 否 会 引起 人 们 
的 担忧 ? 
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第 已 童 - 
操作 系统 


s~ 一 章 ， 我 们 研究 操作 系统 。 操 作 系 统 是 用 来 协调 计算 机 的 内 部 活动 以 及 检查 计算 机 

与 外 部 世界 通信 的 软件 包 。 操 作 系 统 能 将 计算 机 硬件 转化 为 有 用 的 工具 ， 我 们 的 目 

标 就 是 要 理解 操作 系统 做 哪些 工作 ， 以 及 它们 是 如 何 完成 这 些 工作 的 。 要 成 为 有 知识 的 计算 机 
使 用 者 ， 这 样 的 背景 是 极为 重要 的 。 


本 章 内 容 i 
3.1 操作 系统 的 历史 *#3.4 处理 进 程 间 的 竞争 


3.2 操作 系统 的 体系 结构 35 安全 性 加 
3.3 ”协调 机 器 的 活动 


操作 系统 (operation system) 是 控制 计算 机 整体 运行 的 软件 。 它 为 用 户 提供 了 可 以 存储 和 
检索 文件 的 方法 、 可 以 请 求 执行 程序 的 接口 ， 以 及 执行 被 请 求 程序 所 必需 的 环境 。 

操作 系统 最 著名 的 例子 可 能 要 数 Windows 了， 微软 公司 已 经 发 布 了 很 多 版 本 ， 并 广泛 用 于 
PC 领域 。 男 一 个 被 广泛 认可 的 例子 是 UNIX， 它 是 较 大 计算 机 系统 和 PC 的 流行 选择 。 事 实 上 ， 
UNIX 是 其 他 两 个 流行 操作 系统 Mac OS 和 Solaris 的 核心 。 其 中 ，Mac OS 是 苹果 公司 为 其 一 系列 
Mac 机 提供 的 一 种 操作 系统 ;Solaris 是 Sun Microsystems( 现 归 Oracle 所 有 ) 开发 的 。 另 外 ， 还 
有 人 能够 运用 于 大 型 机 和 小 型 机 的 Linux 操 作 系 统 , 该 系统 最 初 是 由 一 些 计 算 机 爱好 者 以 非 僵 利 的 
目的 开发 的 ， 到 目前 为 止 ， 包 括 IBM 公 司 在 内 的 许多 商业 机 构 都 发 布 了 Linux 操 作 系统 。 

对 于 非 专业 的 计算 机 用 户 ， 他 们 只 能 感觉 到 不 同 操作 系统 表面 上 的 不 同 ， 而 对 于 计算 机 
专业 人 员 来 说 ， 不 同 的 操作 系统 可 能 意味 着 使 用 完全 不 同 的 工具 或 在 传播 和 维护 工作 中 遵循 
完全 不 同 的 理念 。 然 而 ， 所 有 主流 操作 系统 的 核心 都 是 解决 计算 机 专家 在 半 个 多 世纪 之 前 就 
已 经 遇 到 的 那些 问题 。 


3.1 操作 系统 的 历史 


今天 的 操作 系统 经 过 长 期 的 演变 已 经 成 为 大 而 复杂 的 软件 包 。20 世 纪 四 五 十 年 代 的 计算 机 
不 是 很 灵活 ， 效 率 也 不 高 。 一 台 机 器 会 占据 整个 房间 。 程 序 执行 需要 大 量 的 设备 准备 工作 ， 如 
安装 磁带 、 把 穿孔 卡片 放 在 卡片 读 入 机 上 、 设 置 开关 等 。 每 个 程序 的 执行 称 为 一 个 作业 (job)， 
它 是 作为 一 个 独立 的 活动 处 理 的 一 一 为 执行 该 程序 准备 好 机 器 ， 执 行程 序 ， 然 后 在 下 一 个 程序 
的 准备 工作 开始 之 前 ， 必 须 重 新 获取 磁带 、 穿 孔 卡片 等 所 有 一 切 。 当 几 个 用 户 需要 共享 一 台 机 
器 时 ， 操 作 系 统 提供 签名 表 ， 以 便 各 个 用 户 能 够 预订 到 一 段 机 器 时 间 。 在 分 配给 某 个 用 户 的 时 
间 段 内 ， 机 器 就 完全 处 于 该 用 户 的 控制 之 下 。 这 段 时 间 通 常 是 从 程序 的 准备 开始 ， 接 下 来 是 短 
时 间 的 程序 执行 过 程 。 一 个 用 户 本 可 以 在 很 短 的 时 间 内 尽 可 能 多 做 一 件 事 情 “ 它 仅 需 1 分 钟 ”)， 
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但 下 一 个 用 户 已 经 迫不及待 地 要 使 用 机 器 做 准备 工作 了 。 

在 这 样 的 环境 下 ， 操 作 系统 开始 作为 一 个 系统 致力 于 简化 程序 的 准备 工作 ， 提 高 作业 之 间 
的 过 渡 效 率 。 操 作 系 统 早期 的 开发 是 用 户 与 设备 的 分 离 ， 用 以 避免 人 员 进 出 计算 机 机 房 ， 为 此 
雇用 了 计算 机 操作 员 来 操作 机 器 。 任 何人 如 果 需 要 运行 程序 ， 就 必须 把 程序 、 所 需 的 数据 以 及 
有 关 程 序 需 求 的 特别 说 明 提 交 给 操作 员 ， 由 操作 员 返 回 结果 。 操 作 员 所 做 的 工作 就 是 把 这 些 资 
料 输 入 机 器 的 海量 存储 器 ， 然 后 由 称 为 操作 系统 的 程序 从 那里 一 次 一 个 地 读 入 并 执行 程序 。 这 
就 是 批 处 理 (batch processing) 的 开始 把 若干 个 要 执行 的 作业 收集 到 一 个 批 次 中 ， 然 后 执 
行 而 无 需 与 用 户 发 生 进一步 的 交互 。 

在 批 处 理 系 统 中 ， 驻 留 在 海量 存储 器 中 的 作业 在 作业 队列 (job queue) 里 等 待 执 行 ( 见 
图 3-1)。 队 列 (queue) 是 一 种 存储 组 织 ， 对 象 〈 这 里 指 作业 ) 按照 先进 先 出 〈first-in，first-out， 
FIFO， 读 作 “FI-foe”) 的 方式 在 队列 里 排队 。 也 就 是 说 ， 对 象 的 出 列 顺 序 和 入 列 顺序 一 致 。 实 
际 上 ， 大 多 数 作业 队列 不 是 严格 遵循 FIFO 结 构 的 ， 主 要 是 因为 大 多 数 操作 系统 都 考虑 了 作业 的 
优先 级 ， 结 果 就 造成 了 在 队列 中 等 待 的 作业 有 可 能 被 优先 级 更 高 的 作业 挤 掉 。 





作业 : 程序 、 结果 
数据 和 指令 


用 户 域 





图 3-1 批 处 理 


在 早期 的 批 处 理 系 统 中 ， 每 个 作业 都 伴随 着 一 组 指令 ， 用 来 说 明 为 这 个 特定 的 作业 准备 机 
器 时 所 需 的 步骤 。 这 些 指 令 用 作业 控制 语言 (job control language，JCL ) 进行 编码 ， 与 作业 一 
起 存储 在 作业 队列 里 。 当 一 个 作业 被 选中 执行 时 ， 操 作 系统 在 打印 机 上 打印 出 这 些 指令 以 便 计 
算 机 操作 员 阅 读 和 遵照 执行 。 现 在, 计算 机 操作 员 与 操作 系统 之 间 的 通信 仍然 存在 , 如 报告 “网 
络 不 可 用 ”和 “打印 机 没有 响应 ”之 类 的 错误 的 PC 操作 系统 。 

在 计算 机 和 计算 机 用 户 之 间 ， 用 计算 机 操作 员 作 为 媒介 的 最 大 缺点 是 : 作业 一 旦 提交 给 操 
作 员 ， 用 户 就 无 法 与 作业 交互 了 。 这 种 方法 对 于 某 些 应 用 是 可 以 接受 的 ， 如 工资 表 的 处 理 ， 因 
为 在 这 里 ， 数 据 与 所 有 的 处 理 决 策 事先 已 经 建立 了 。 然 而 ， 当 在 一 个 程序 的 执行 期 间 ， 用 户 必 
须 与 该 程序 进行 交互 时 ， 这 种 方法 就 无 法 让 人 接受 了 。 例 如 ， 在 预订 系统 中 ， 预 订 和 取消 操作 
必须 及 时 报告 ， 在 字 处 理 系统 中 ， 文 档 是 以 动态 的 写 入 和 重 写 方式 开发 的 ; 在 计算 机 游戏 中 ， 
与 机 器 的 交互 性 是 游戏 的 主要 特征 。 

为 了 适应 这 些 需 求 ， 人 们 开发 了 新 的 操作 系统 ， 它 们 允许 执行 一 个 程序 来 通过 远程 终端 与 
用 户 对 话 一 一 这 种 特性 称 为 交互 式 处 理 (interactive processing)( 见 图 3-2)。( 一 个 终端 只 不 过 是 
一 台电 子 打字 机 , 通过 电子 打字 机 ,用 户 能 够 进行 输入 并 且 读 出 那些 打印 在 纸 上 的 计算 机 响应 。 
当今 的 终端 已 经 演变 成 更 为 复杂 的 称 为 工作 站 的 设备 ， 而 且 在 必要 时 甚至 还 可 以 是 一 台 完 全 独 
立 运行 的 完整 PC。) 

成 功 的 交互 式 处 理 的 最 重要 之 处 在 于 ， 计 算 机 的 动作 能 够 足够 快速 地 协调 用 户 的 需求 ， 而 
不 是 让 用 户 遵 循 机 器 的 时 间 表 。( 在 进行 工资 表 的 处 理 时 , 计算 机 能 够 根据 所 需 的 时 间 量 调度 得 
很 好 , 但 是 在 使 用 字 处 理 程 序 时 , 如 果 机 器 不 能 敏捷 地 对 字符 的 打印 作出 响应 , 用 户 会 很 姐 丧 。) 
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从 某 种 意义 上 说 ， 计 算 机 是 被 强制 在 一 个 限期 内 执行 任务 ， 这 一 过 程 就 是 众所周知 的 实时 处 理 
(real-time processing)， 并 且 动 作 的 完成 也 是 按 实 时 方式 发 生 的 。 也 就 是 说 ， 要 是 说 一 台 计 算 机 
以 实时 的 方式 完成 一 个 任务 ， 就 意味 着 这 台 计 算 机 完成 任务 的 速度 足以 跟 上 该 任务 所 在 的 (外 
部 现实 世界 ) 环境 中 的 行为 。 


程序 、 数 据 、 指 令 和 结果 


用 户 域 





图 3-2 交互 式 处 理 


如 果 要 求 交 互 式 系统 一 次 只 服务 于 一 个 用 户 ， 那 么 实时 处 理 就 不 存在 问题 了 。 但 是 20 世 纪 
六 七 十 年 代 的 计算 机 比较 昂贵 ， 所 以 每 台 机 器 不 得 不 服务 于 多 个 用 户 。 因 此 ， 工 作 在 远程 终端 
的 若干 个 用 户 在 同一 时 间 寻 求 一 台 机 器 的 交互 式 服务 ， 从 而 导致 实时 交互 障碍 的 现象 很 常见 。 
如 果 操 作 系 统 对 于 多 用 户 环 境 仍 然 坚 持 一 次 执行 一 个 作业 ， 那 么 将 只 有 一 个 用 户 可 得 到 满意 的 
实时 服务 。 

针对 这 个 问题 的 解决 方案 就 是 设计 能 同时 给 多 个 用 户 提供 服务 的 操作 系统 ， 这 一 特点 称 为 
分 时 〈time-sharing)。 实 现 分 时 的 一 种 方法 就 是 应 用 多 道 程序 设计 Cmultiprogramming) 技术 ， 
其 中 时 间 被 分 割 成 时 间 片 , 每 个 作业 的 执行 被 限制 为 每 次 仅 一 个 时 间 片 。 在 每 个 时 间 片 结束 时 ， 
当前 的 作业 和 暂时 放弃 执行 ， 允 许 男 一 个 作业 在 下 一 个 时 间 片 里 执行 。 通 过 这 种 方法 可 以 快速 地 
在 各 个 作业 之 间 进 行 切 换 ， 形 成 若干 个 作业 同时 执行 的 假象 。 依 据 所 执行 的 作业 的 类 型 ， 早 期 
的 分 时 系统 能 够 同时 为 多 达 30 个 用 户 提 供 可 接受 的 实时 服务 。 今 天 ， 多 道 程序 设计 既 可 用 于 单 
用 户 系 统 ， 也 可 以 用 于 多 用 户 系 统 ， 前 者 通常 称 为 多 任务 处 理 (multitasking)。 也 就 是 说 ， 分 时 
指 的 是 多 个 用 户 共享 对 同一 计算 机 的 访问 ， 而 多 任务 处 理 指 的 是 一 个 用 户 同时 执行 多 个 任务 。 

随 着 多 用 户 的 发 展 , 分 时 操作 系统 作为 一 种 典型 计算 机 配置 , 被 用 在 大 型 的 中 央 计 算 机 上 ， 
用 来 连接 大 量 的 工作 站 。 通 过 这 些 工作 站 ， 用 户 能 够 从 机 房 外 面 直接 与 计算 机 进行 通信 ， 而 不 
用 把 请 求 递交 给 计算 机 操作 员 。 通 常 ， 常 用 的 程序 会 被 存储 在 机 器 的 海量 存储 设备 上 ， 然 后 通 
过 操作 系统 来 响应 工作 站 的 请 求 并 执行 这 些 程 序 。 这 样 ， 作 为 计算 机 与 用 户 的 中 间 媒 介 的 计算 
机 操作 员 的 作用 就 不 那么 明显 了 。 

到 今天 ， 计 算 机 操作 员 在 事实 上 已 经 不 存在 了 ， 特 别 是 在 个 人 计算 机 领域 ， 计 算 机 用 户 已 
经 能 够 承担 操作 计算 机 的 所 有 职责 。 即 使 是 最 大 型 的 计算 机 系统 ， 其 运行 也 基本 上 无 须 人 工 参 
与 。 事 实 上 ， 传 统 的 计算 机 操作 员 已 经 让 位 于 系统 管理 员 ， 系 统管 理 员 管理 计算 机 系统 获得 
和 监控 计算 机 新 设备 和 软件 的 安装 ， 实 施 一 些 本 地 的 规则 ， 例 如 ， 建 立新 的 账号 ， 为 不 同 的 用 
户 划分 一 定 的 海量 存储 空间 ， 协 调用 户 一 起 解决 系统 中 出 现 的 问题 ， 这 样 就 比 纯 手 工 方 式 操作 
机 器 要 好 得 多 。 

总 之 ， 操 作 系 统 已 经 从 一 次 获取 和 执行 一 个 程序 的 简单 程序 ， 发 展 为 能 够 协调 分 时 ， 能 够 
维护 机 器 海量 存储 设备 上 的 程序 和 数据 文件 ， 并 能 直接 响应 计算 机 用 户 请 求 的 复杂 系统 。 

但 是 ， 计 算 机 操作 系统 的 发 展 仍 在 继续 。 多 处 理 器 机 器 的 发 展 已 经 让 操作 系统 能 够 进行 分 
时 /多 任务 处 理 ， 操 作 系统 把 不 同 的 任务 分 配给 不 同 的 处 理 器 进行 处 理 ， 并 且 采 用 分 时 机 制 共享 
单个 处 理 器 。 这 些 操作 系统 必须 处 理 负 载 平衡 〈load balancing， 把 任务 动态 地 分 配给 各 个 处 理 
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器 ， 使 得 所 有 处 理 器 都 得 到 有 效 的 利用 ) 和 均 分 (scaling， 把 任务 划分 为 若干 个 子 任务 ， 与 可 
用 的 处 理 器 数目 相 匹 配 ) 问题 。 

此 外 ， 计 算 机 网 络 的 出 现 ( 相 距 很 远 的 大 量 机 器 连接 在 一 起 ) 使 得 有 必要 发 展 相 应 的 软件 
系统 来 规范 网 络 的 行为 。 计算机 网 络 领 域 (我 们 将 在 第 4 章 学 习 这 部 分 内 容 ) 在 许多 方面 拓展 了 
操作 系统 这 个 学 科 ， 其 目标 是 跨 多 个 用 户 和 多 个 机 器 《〈 而 非 单个 的 、 孤 立 的 计算 机 ) 管理 资源 。 

操作 系统 的 另 一 个 研究 方向 的 侧重 点 是 专用 于 特定 任务 的 设备 ， 如 医疗 设备 、 车 载 电 子 设备 、 
家 用 电器 、 手 机 或 其 他 手持 电脑 。 这 些 设 备 中 的 计算 机 系统 称 为 内 入 式 系统 (embedded system )。 
舱 入 式 操 作 系统 通常 能 够 节省 电池 电量 、 满 足 严 格 的 实时 截止 时 间 ， 或 在 只 有 很 少 或 完全 没有 人 为 
监管 的 情况 下 连续 工作 。 在 这 些 努 力 中 ， 有 代表 性 的 成 功 系统 有 : Wind River Systems 公 司 开发 的 曾 
用 于 勇气 号 (Spirit) 和 机 遇 号 〈Opportunity) 火星 探测 器 的 VxWORKS; 微软 开发 的 Windows CE 
(也 就 是 众所周知 的 Pocket PC)，PalmSource 公 司 开发 的 用 于 手持 设备 的 Palm OS。 


智能 手机 有 什么 功能 

手机 的 功能 越 来 赵强 大 ， 除了 能 够 简单 处 理 语音 通话 之 外 还 能 提供 其 他 服务 . 现在 ， 党 
见 的 智能 手机 (smartphone ) 可 以 用 于 编写 文本 信息 、 浏 览 万 维 网 、 导 航 、 查 看 多 媒体 内 容 
等 ， 简 而 言 之 ， 它 可 以 提供 许多 传统 的 个 人 计算 机 所 能 提供 的 服务 。 因 此 ， 智 能 手机 需要 成 
热 的 操作 系统 来 管理 有 限 的 智能 手机 硬件 资源 ， 并 提供 一 些 支 持 迅 速 增加 的 智能 手机 应 用 软 
件 的 特性 。 智 能 手机 操作 系统 市 场 的 争夺 战 将 日 趋 激 烈 ， 而 争夺 的 焦点 很 有 可 能 在 于 哪个 操 
作 系 统 可 以 以 最 优 的 价格 提供 最 有 创意 的 功能 。 智 能 手机 操作 系统 领域 中 的 竞争 者 包括 苹果 
公司 的 iPhone OS、Research In Motion 的 BlackBerry OS、 微 软 的 Windows Phone、 诺 基 亚 的 
Symbian OS， 以 及 谷歌 的 Android 





问题 与 练习 

. 举 出 几 个 队列 的 例子 。 对 于 每 一 种 情况 ， 请 指出 任何 可 能 破坏 FIFO 结 构 的 情况 。 
. 下 列 任务 中 哪些 需要 用 到 实时 处 理 技术 ? 

a. 打印 邮件 标签 。 

b. 玩 计算 机 游戏 。 

c, 拨号 时 ， 把 这 些 数字 显示 在 智能 手机 屏幕 上 。 

d. 执行 一 个 预报 下 一 年 经 济 状况 的 程序 。 

e. 播放 MP3 录 音 。 

嵌入 式 系统 与 PC 的 区 别 是 什么 ? 

分 时 与 多 任务 处 理 的 区 别 是 什么 ? 
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为 了 能 够 理解 一 个 典型 操作 系统 的 组 成 ， 这 里 我 们 首先 考虑 一 个 典型 的 计算 机 系统 中 有 哪 
些 软件 ， 这 些 软件 是 如 何 分 类 的 ， 然 后 我 们 再 回 到 操作 系统 上 来 。 
3.2.1 软件 概述 

我 们 通过 提出 一 个 软件 分 类 方案 来 考察 一 个 典型 计算 机 系统 中 的 软件 。 这 种 分 类 方案 总 是 
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把 一 些 类 似 的 软件 单元 放 在 不 同 的 类 里 ， 其 方法 如 同时 区 的 划分 ， 时 区 的 划分 使 得 相 邻 时 区 的 
设置 相差 一 小 时 ， 即 使 其 日 出 与 日 落 的 时 间 没 有 明显 的 差别 。 其 次 ， 在 软件 分 类 的 情况 下 ， 学 
科 的 发 展 变化 和 某 种 权威 的 缺乏 ， 导 致 出 现 了 一 些 矛盾 的 术语 。 例 如 ， 微 软 公 司 Windows 操 作 
系统 的 用 户 会 发 现 ,“ 附 件 ” 和 “管理 工具 ”程序 组 ， 既 包括 应 用 类 软件 又 包括 实用 类 软件 。 因 
此 ， 下 面 的 分 类 方法 应 该 被 看 作 在 广泛 的 、 动 态 的 学 科 里 占有 一 席 之 地 的 方法 ， 而 不 是 对 人 们 
普遍 接受 的 事实 的 一 种 表述 。 

先 把 机 器 软件 分 为 两 大 类 : 应 用 软件 Capplication software) 和 系统 软件 〈system software ) 
( 见 图 3-3)。 应 用 软件 是 由 一 些 完成 机 器 特定 任务 的 程序 组 成 的 。 一 台 用 来 维护 某 个 制造 公司 库 
存单 的 机 器 所 包含 的 应 用 软件 与 电气 工程 师 用 的 机 器 里 的 应 用 软件 是 不 同 的 。 应 用 软件 的 例子 
有 电子 制 表 软件 、 数 据 库 系 统 、 桌 面 出 版 系统 、 记 账 系 统 、 程 序 开发 软件 以 及 游戏 等 。 


软件 





在 
图 3-3 ”软件 分 类 


相对 于 应 用 软件 而 言 ， 系 统 软件 完成 的 是 一 般 的 计算 机 系统 都 需要 完成 的 任务 。 从 某 种 意 
义 上 来 说 ， 系 统 软件 提供 了 应 用 软件 所 需要 的 基础 架构 ， 这 和 国家 基础 架构 (政府 、 道 路 、 公 
共 设 施 、 金 融 机 构 等 ) 提供 公民 维系 各 自生 活 方式 的 基础 的 方式 大 致 相同 。 

系统 软件 又 可 分 两 类 ， 一 类 是 操作 系统 本 身 ， 另 一 类 是 统称 为 实用 软件 “utility software) 
的 软件 单元 。 安 装 的 大 多 数 实用 软件 包括 这 样 一 些 程序 ， 它 们 实现 的 活动 仅仅 是 计算 机 安装 的 
基础 ， 而 没有 包含 在 操作 系统 中 。 从 某 种 意义 上 说 ， 实 用 软件 是 由 一 些 能 够 扩充 或 定制 ) 操 
作 系 统 功能 的 软件 单元 组 成 的 。 举 例 来 说 ， 格 式 化 磁盘 或 将 文件 从 磁盘 复制 到 光盘 中 去 的 能 力 
一 般 都 是 借助 于 实用 程序 来 实现 的 ， 而 不 是 在 操作 系统 内 部 实现 的 。 其 他 的 实用 软件 的 例子 包 
括 压 缩 数据 和 解压 缩 数据 的 软件 、 播 放 多 媒体 演示 的 软件 以 及 处 理 网 络 通信 的 软件 。 

把 某 些 活动 实现 为 实用 软件 ， 比 把 它们 放 在 操作 系统 中 ， 更 容易 按 特定 安装 需求 定制 系统 
软件 。 事 实 上 ， 公 司 或 个 人 对 机 器 操作 系统 原先 提供 的 实用 软件 进行 修改 和 扩充 ， 已 经 是 很 普 
通 的 事情 了 。 

遗憾 的 是 ， 应 用 软件 与 实用 软件 之 间 的 差别 已 经 很 模糊 了 。 从 我 们 的 观点 来 看 ， 它 们 的 差 
别 在 于 其 是 否 是 计算 机 “软件 架构 ”的 一 部 分 。 因 此 ， 当 一 个 新 应 用 变 成 一 种 基础 工具 时 ， 这 
个 应 用 就 很 可 能 成 为 一 种 实用 软件 。 当 用 于 因特网 通信 的 软件 还 在 研究 阶段 时 ， 它 被 认为 是 一 
种 应 用 软件 ， 而 如 今 ， 像 这 样 的 工具 对 大 部 分 PC 应 用 而 言 已 经 是 非常 基础 的 了 ， 因 此 被 归 类 为 
实用 软件 。 

实用 软件 和 操作 系统 的 差别 同样 是 模糊 的 。 特 别 是 ， 美 国 和 欧洲 的 反 垄 断 诉讼 案 争 论 的 都 
是 这 样 一 个 问题 ， 像 浏览 器 和 媒体 播放 器 这 样 的 软件 单元 是 微软 公司 操作 系统 的 一 部 分 ， 还 是 
微软 公司 用 来 压制 竞争 对 手 的 实用 软件 。 
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”对 于 计算 机 爱好 者 而 言 ， 如 果 想 通过 亲手 实验 来 了 解 一 个 操作 系统 ， 那 么 就 应 该 选择 
Linux。Linux 操 作 系统 最 初 是 由 Linus Torvalds 在 社 尔 辛 基 大 学 学 习 期 间 设 计 的 Linux 操 作 系 
统 是 一 个 非 专 有 产品 ,我 们 可 以 免费 获得 它 的 源 代码 ( 见 第 6 章 ) 和 相关 文档 。 因 为 可 以 免费 
获得 其 源 代码 ， 所 以 该 系统 在 计算 机 爱好 者 、 学 习 操 作 系 统 的 学 生 和 程序 员 中 非常 流行 。 而 
且 ，Linux 操 作 系 统 被 认为 是 当今 可 用 的 较 可 靠 的 操作 系统 之 一 。 正 因为 这 个 原因 ， 一 些 公 

司 开始 以 更 实用 的 形式 包装 和 销售 Linux 操 作 系 统 产 品 , 现在 这 些 产 品 开 始 向 市 场 上 长 期 被 
认可 的 商用 操作 系统 产品 发 出 了 挑战 。 我 们 可 以 在 www.linux.org 这 个 网 站 了 解 更 多 有 关 

,Linux 的 知识 。 


3.2.2 ”操作 系统 组 件 


现在 , 我 们 把 注意 力 集中 在 操作 系统 领域 内 的 组 件 上 。 为 了 完成 计算 机 用 户 请 求 的 动作 ， 
操作 系统 必须 能 够 与 这 些 用 户 进行 通信 。 操 作 系 统 负责 处 理 这 种 通信 的 部 分 通常 称 为 用 户 界 
面 (user interface)。 老 式 的 用 户 界面 称 为 外 壳 (shell)， 通 过 键盘 和 显示 屏 用 文本 信息 与 用 
户 通信 。 更 现代 化 的 系统 利用 图 形 用 户 界面 (Graphical User Interface，GUI) 实现 与 用 户 的 
通信 ， 其 中 操作 的 对 象 〈 如 文件 和 程序 ) 被 表示 为 显示 屏 上 的 图 标 〈icon)。 这 些 系统 允许 
用 户 使 用 某 种 常用 的 输入 设备 发 出 命令 。 例 如， 有 一 个 或 多 个 按键 的 计算 机 鼠标 可 用 来 单 击 
或 拖 遇 屏幕 上 的 图 标 。 另 外 ， 平 面 设 计 师 或 某 些 类 型 的 手持 设备 常 使 用 专用 的 点 击 设备 
(pointing device) 或 手写 笔 〈stylus) 代替 鼠标 来 操作 图 标 。 最 近 ， 高 密度 触摸 屏 的 进步 使 
得 用 户 可 以 直接 用 手指 操作 图 标 。 而 当今 的 GUI 使 用 二 维 图 像 投 影 系统 ,三维 界 面 允许 人 类 
用 户 通 过 3D 投 影 系统 、 和 触觉 感知 设备 和 环绕 声音 频 再 生 系统 与 计算 机 进行 通信 ， 这 些 都 是 
当前 研究 的 课题 。 

虽然 操作 系统 的 用 户 界 面 在 实现 机 器 的 功能 上 扮演 了 重要 的 角色 ， 但 它 仅 仅 是 计算 机 用 户 
与 操作 系统 真实 内 核 之 间 的 一 个 接口 而 已 ( 见 图 3-4)。 
用 户 界面 与 操作 系统 内 部 之 间 的 区 别 的 呈现 是 因为 这 
样 一 个 事实 ， 即 一 些 操作 系统 允许 用 户 从 各 种 界面 中 选 
择 最 合适 的 界面 为 自己 服务 。 例如, UNIX 操作 系统 的 用 
户 就 可 以 选择 不 同 的 shell， 包 括 Bourne shell、C shell 和 
Kor shell ， 以 及 称 为 Xl1 的 GUI。 最 早 的 Microsoft 
Windows 是 一 个 GUI 应 用 程序 , 可 以 通过 MS-DOS 操 作 系 
统 的 shell 命 令 加 载 。 在 最 新 版 Windows 中 ， 人 们 仍 可 看 
见 作 为 实用 程序 存在 的 DOS shell cmd.exe， 但 非 专业 
用 户 几 乎 完全 不 需要 使 用 这 一 界面 。 类 似 地 ， 苹 果 公 
司 的 OS X 保 留 了 一 个 Terminal 实 用 软件 Cutility shell)， 
a 图 3-4 “作为 用 户 和 操作 系统 内 术 

现在 的 GUI shell 中 的 重要 组 件 是 窗口 管理 程序 3-4 ”作为 用 户 和 操作 系统 内 核 
(window manager)， 该 程序 在 屏幕 上 分 配 若干 个 称 为 TO 
窗口 的 块 ， 跟 踪 与 每 个 窗口 相 联系 的 应 用 程序 。 当 一 个 应 用 程序 想 在 屏幕 上 显示 图 像 时 ， 它 就 
会 通知 窗口 管理 程序 ， 窗 口 管理 程序 就 会 把 所 需 的 图 像 放 在 分 配给 该 应 用 程序 的 窗口 里 。 然 后 ， 
当 鼠 标 被 单 击 时 ， 窗 口 管理 程序 计算 鼠标 在 屏幕 上 的 位 置 ， 并 把 这 个 鼠标 动作 通知 给 相应 的 应 
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用 程序 。 窗 口 管理 程序 负责 生成 GUI“ 样 式 ” 大 多 数 管理 程序 会 提供 一 系列 配置 选项 。Linux 用 
户 甚 至 可 以 选择 窗口 管理 程序 ， 常 用 的 选项 包括 KDE 和 Gnome。 

与 操作 系统 的 用 户 界面 相对 ， 我 们 把 操作 系统 的 内 部 部 分 称 为 内 核 (kernel)。 操 作 系 统 的 
内 核 包含 一 些 完成 计算 机 安装 所 需 的 极 基 本 功能 的 软件 组 件 。 其 中 一 个 组 件 是 文件 管理 程序 
(file manager)， 它 的 工作 是 协调 机 器 海量 存储 器 设施 的 使 用 。 更 准确 地 说 ， 文 件 管理 程序 维护 
着 存储 在 海量 存储 器 上 的 所 有 文件 的 记录 ， 包 括 每 个 文件 的 位 置 、 哪 些 用 户 有 权 访 问 各 种 文件 
以 及 海量 存储 器 里 的 哪些 部 分 可 以 用 来 建立 新 文件 或 扩充 现 有 文件 。 这 些 记录 被 存放 在 单独 的 
包含 相关 文件 的 存储 介质 中 ， 这 样 ， 每 次 存储 介质 联机 时 ， 文 件 管理 程序 就 能 够 检索 相关 的 文 
件 ， 进 而 就 能 知道 特定 的 存储 介质 中 存放 的 是 什么 。 

为 了 方便 机 器 用 户 ， 大 多 数 文件 管理 程序 都 允许 把 若干 个 文件 组 织 在 一 起 ， 放 在 目录 
(Cdirectory) 或 文件 夹 (folder) 里 。 这 种 方法 允许 用 户 将 自己 的 文件 依据 用 途 划 分 ， 把 相关 的 文件 
放 在 同一 个 目录 里 。 一 个 目录 可 以 包含 称 为 子 目录 的 其 他 目录 , 这 样 就 可 以 构建 层次 化 的 目录 结构 。 
例如 ， 用 户 可 以 创建 一 个 名 为 MyRecords 的 目录 ， 它 又 包含 了 3 个 名 为 FinancialRecords、 
MedicalRecords 和 HouseHoldRecords 的 子 目 录 。 每 个 子 目 录 中 都 会 有 属于 该 类 别 的 文件 。 
(Windows 操 作 系 统 的 用 户 可 通过 执行 实用 程序 “Windows 资 源 管理 器 ”让 文件 管理 程序 显示 当 
前 的 目录 结构 。) 

一 条 由 目录 内 的 目录 所 组 成 的 链 称 为 目录 路 径 (directory path)。 路 径 通 常 是 这 样 表示 的 : 
列 出 沿 该 路 径 的 目录 , 然后 用 斜 杠 分 阳 它 们 。 例如 ， 路 径 animals/prehistoric/dinosaurs 
表示 的 是 : 该 路 径 是 从 目录 名 为 animals 的 目录 开始 的 ， 经 过 名 为 prehistoric 的 子 目 录 ， 终 
止 于 名 为 ainosaurs 的 子 目录 。( 对 于 Windows 用 户 而 言 ， 目 录 路 径 是 用 反 斜 杠 表示 的 ， 如 
animals\prehistoric\dinosaurs,) 

其 他 软件 单元 能 否 访问 某 个 文件 ， 由 文件 管理 程序 来 决定 。 该 访问 过 程 先 通过 一 个 称 为 打 
开 文 件 的 过 程 来 请 求 文 件 管理 程序 授权 访问 该 文件 。 如 果 文 件 管理 程序 批准 了 该 访问 请 求 ， 那 
么 它 就 会 提供 查找 和 操控 该 文件 所 需 的 信息 。 

内 核 的 另外 一 个 组 件 是 一 组 设备 驱动 程序 (device driver)， 它 们 人 负责 与 控制 器 (有 时 直接 
与 外 围 设备 ) 通信 ， 以 操作 连接 到 机 器 的 外 围 设备 的 软件 单元 。 每 个 设备 驱动 程序 都 是 专门 为 
特定 类 型 的 设备 〈 如 打印 机 、 磁 盘 驱 动 器 或 显示 器 ) 设计 的 ， 它 把 一 般 的 请 求 翻 译 为 这 种 设备 
(分 配给 这 个 驱动 程序 的 设备 ) 所 需要 的 更 富 技术 性 的 步骤 。 例 如， 打印 机 的 设备 驱动 程序 包含 
的 软件 能 够 读 取 和 人 解码 特定 打印 机 的 状态 字 , 而 且 还 能 够 处 理 其 他 一 些 信息 交换 的 细节 。 这 样 ， 
其 他 软件 组 件 就 不 必 为 打印 一 个 文件 而 处 理 那 些 技术 细节 了 。 相 反 ， 只 需 运 用 设备 驱动 程序 软 
件 完成 打印 文件 的 任务 ， 并 把 技术 细节 交 由 设备 驱动 程序 处 理 。 按 照 这 种 方式 ， 其 他 软件 组 件 
的 设计 可 以 独立 于 具体 设备 特有 的 特征 。 这 样 做 的 结果 是 ， 我 们 只 要 为 一 个 普通 的 操作 系统 安 
装 合适 的 设备 驱动 程序 ， 它 就 能 够 使 用 特殊 的 外 围 设备 。 

在 操作 系统 的 内 核 中 , 还 有 一 个 组 件 就 是 内 存 管 理 程序 (memory manager)， 它 担负 着 协调 
机 器 使 用 主 存储 器 的 任务 。 在 计算 机 一 次 仅 执 行 一 个 任务 的 环境 中 ， 这 些 职责 是 最 小 的 。 这 些 
情况 下 ， 执 行当 前 任务 的 程序 会 被 放 在 主 存储 器 中 已 经 定义 好 的 位 置 上 执行 ， 然 后 被 执行 下 一 
个 任务 的 程序 替换 。 然 而 ， 在 多 用 户 和 多 任务 处 理 的 环境 下 ， 计 算 机 被 要 求 在 同一 时 刻 能 够 处 
理 多 个 需求 ， 这 时 内 存 管 理 程序 的 职责 就 扩展 了 。 在 这 些 情况 下 ， 许 多 程序 和 数据 块 必须 同时 
驻 留 在 内 存 里 。 因 此 ， 内 存 管 理 程序 必须 为 这 些 需 求 寻 找 并 分 配 内 存 空 间 ， 并 且 要 保证 每 个 程 
序 只 能 限制 在 程序 所 分 配 的 内 存 空间 内 运行 。 此 外 ， 随 着 不 同 活动 的 需求 进出 内 存 ， 内 存 管理 
程序 必须 能 跟踪 那些 不 再 被 占用 的 内 存 区 域 。 

当 所 需 的 总 主 存储 器 空间 超过 该 计算 机 实际 所 能 提供 的 可 用 内 存 空间 时 ， 内 存 管 理 程序 的 


98 第 3 章 操作 系统 


任务 会 更 复杂 。 在 这 种 情况 下 ， 内 存 管 理 程序 会 在 主 存储 器 与 海量 存储 器 之 间 来 回 切换 程序 和 
数据 [这 种 技术 称 为 页 面 调度 (paging)]， 从 而 造成 有 额外 内 存 空 间 的 假象 。 例 如 ， 假 设 需要 一 
个 8 GB 大 小 的 主 存储 器 , 但 是 计算 机 所 能 提供 的 只 有 4 GB。 为 了 造成 具有 更 大 内 存 空间 的 假象 ， 
内 存 管 理 程序 在 磁盘 上 预 留 了 4 GB 的 存储 空间 。 在 这 块 存储 区 域 里 ， 将 记录 内 存 实际 容量 有 8 
GB 时 本 应 存储 在 内 存 中 的 位 模式 。 这 块 数据 区 被 分 成 大 小 一 致 的 称 为 页 面 (page) 的 存储 单元 ， 
典型 的 页 面 一 般 是 几 KB 大 小 。 于 是 ,内存 管理 程序 就 在 主 存储 器 和 海量 存储 器 之 间 来 回 切 换 这 
些 页 面 。 这 样 ， 在 任何 给 定 的 时 间 内 ， 我 们 所 需 的 页 面 都 会 出 现在 4 GB 的 主 存储 器 之 中 ， 最 后 
的 结果 是 计算 机 能 够 像 确实 拥有 8 GB 主 存 储 器 一 样 工作 。 这 块 由 页 面 调 度 所 产生 的 大 的 “虚构 
的 ”内 存 空间 被 称 作 虚 拟 内 存 (virtual memory)。 

另外 ， 在 操作 系统 内 核 中 还 有 调度 程序 (scheduler) 和 分 派 程序 (dispatclier) 这 两 个 组 件 ， 
我 们 将 在 下 一 节 介 绍 。 在 此 ， 我 们 只 需 注 意 ， 在 多 道 程序 设计 系统 中 调度 程序 决定 哪些 活动 是 
可 以 执行 的 ， 而 分 派 程 序 控制 这 些 活动 的 时 间 分 配 。 


3.2.3 系统 启动 


我 们 已 经 可 以 看 出 ， 操 作 系 统 提供 了 其 他 软件 单元 所 需 的 软件 基础 设施 ， 但 是 我 们 还 没有 
细 想 操作 系统 本 身 是 如 何 启动 的 。 这 是 通过 引导 (boot strapping， 简 称 为 booting) 过 程 实现 的 ， 
这 个 过 程 是 由 计算 机 在 每 次 启动 的 时 候 完成 的 。 正 是 这 个 过 程 把 操作 系统 从 海量 存储 器 (操作 
系统 永久 存储 的 地 方 ) 传送 到 主 存储 器 〈 在 开机 时 ， 主 存储 器 实际 上 是 空 的 ) 中 。 为 了 理解 启 
动 过程 和 必须 有 启动 过 程 的 原因 ， 我 们 先 来 考察 机 器 的 CPU。 

CPU 的 设计 使 得 每 次 CPU 启动 时 ， 它 的 程序 计数 器 都 从 事先 确定 的 特定 地 址 开始 。CPU 就 
期 望 能 在 这 个 地 址 上 找到 程序 要 执行 的 第 一 条 指令 。 从 概念 上 讲 ， 只 需 在 这 个 地 址 上 存储 操作 
系统 。 然 而 ， 从 技术 上 讲 ， 计 算 机 的 主 存储 器 通常 是 采用 易 失 性 技术 制造 的 ， 这 意味 着 ， 当 计 
算 机 关闭 时 ， 存 储 在 内 存 上 的 数据 会 丢失 。 因 此 ， 在 每 次 重启 计算 机 的 时 候 ， 必 须 重 新 填充 主 
存储 器 的 内 容 。 

简 言 之 ， 当 计算 机 首次 打开 时 ,我 们 需要 一 个 程序 (最 好 是 操作 系统 ) 存在 于 主 存储 器 
中 , 但 是 每 次 关机 时 , 计算 机 的 易 失 性 存储 器 都 会 被 擦 除 。 为 了 解决 这 个 两 难 问题 ,计算 机 
的 一 小 部 分 主 存储 器 就 用 特殊 的 非 易 失 性 存储 单元 建造 , 而 这 里 正 是 CPU 期 望 找到 初始 程序 
的 地 方 。 由 于 这 种 存储 器 的 内 容 可 以 读 取 , 但 不 可 以 改变 ,因而 被 称 为 只 读 存 储 器 (read-only 
memory，ROM)。 打 个 比方 ， 虽 然 所 使 用 的 技术 是 更 先进 的 ， 但 我 们 可 以 把 在 ROM 中 存储 
位 模式 想象 成 熔断 微小 的 保险 丝 ( 熔 断 的 表示 1， 未 熔断 的 表示 0)。 更 确切 地 说 ， 如 今 个 人 
计算 机 中 大 多 数 的 ROM 是 用 闪存 技术 构建 的 ( 即 不 是 严格 意义 上 的 ROM， 因 为 它 可 以 在 特 
定 情况 下 被 改变 )。 

在 一 般 的 计算 机 中 ， 引 导 装 入 程序 (bootloader) 被 永久 存储 在 机 器 的 ROM 中 。 这 样 ， 在 
计算 机 开机 的 时 候 将 最 先 执 行 这 个 程序 。 引 导 装 入 程序 的 任务 是 引导 CPU 把 操作 系统 从 海量 存 
储 器 中 预先 定义 的 位 置 调 入 主 存储 器 的 易 失 性 存储 区 ( 见 图 3-5)。 现 代 的 引导 装 入 程序 可 以 从 
各 种 位 置 将 操作 系统 复制 到 主 存储 器 中 。 例 如 ， 在 嵌入 式 系统 如 智能 手机 中 ， 操 作 系统 是 从 特 
殊 的 闪 速 〈 非 易 失 性 ) 存储 器 复制 的 ， 在 大 型 公司 或 大 学 的 小 型 工作 站 上 ， 可 能 要 通过 网 络 从 
远程 机 器 上 复制 操作 系统 。 一 旦 操作 系统 被 放 入 主 存储 器 ， 引 导 装 入 程序 就 引导 CPU 执行 转 
移 指令 ， 转 到 这 个 存储 区 。 这 时 ， 操 作 系统 接管 并 开始 控制 机 器 的 活动 。 执 行 引 导 装 入 程 
序 和 启动 操作 系统 的 整个 过 程 称 作 引导 (booting) 计算 机 。 
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主 存储 器 
引导 磁盘 存储 器 
ou 县 本 党 7 
易 失 性 
存储 器 
操作 系统 操作 系统 
步骤 1， 机 器 由 执行 已 在 存储 器 中 的 引导 装 入 程序 步骤 2: 引导 装 入 程序 把 操作 系统 传送 到 主 存储 器 
开始 启动 。 操 作 系统 存放 在 海量 存储 器 中 中 ， 并 把 控制 权 交 给 它 


图 3-5 引导 过 程 





除了 引导 装 入 程序 外 ，PC 的 只 读 存 储 器 还 包括 了 一 组 软件 例 程 ， 用 于 实现 基本 的 输入 / 输 
出 活动 ， 如 从 键盘 上 接收 信息 、 把 信息 显示 在 计算 机 的 屏幕 上 ， 以 及 从 海量 存储 器 上 读数 据 
等 。 因 为 这 些 例 程 存储 在 非 易 失 性 存储 器 (如 FlashROM ) 中 ， 所 以 它们 不 会 不 变 地 固化 到 机 
器 的 硅 片 (硬件 ) 中 ， 也 不 像 海 量 存储 器 中 的 其 他 程序 (软件 ) 那样 随时 可 被 更 改 。 人 们 创 
造 了 固件 (firmware ) 这 个 术语 来 描述 这 一 “中 间 地 带 ”。 固 件 例 程 可 以 被 引导 装 入 程序 用 来 
在 操作 系统 开始 工作 之 前 完成 IO 活动 。 例如， 它们 可 用 于 在 引导 过 程 真正 开始 之 前 ， 与 计算 
机 用 户 进 行 通信 ， 并 在 引导 期 间 报告 错误 。 得 到 广泛 使 用 的 固件 系统 包括 PC 中 一 直 使 用 的 基 
本 输入 /输出 系统 (Basic Input/Output System，BIOS )、 较 新 的 可 扩展 固件 接口 ( Extensible 
Firmware Interface，EFI)、Sun 公 司 的 Open Firmware ( 现 为 Oracle 的 一 个 产品 )， 以 及 用 于 许 
多 谈 入 式 设备 的 通用 国 件 环 境 (common firmware environment，CFE )。 


你 也 许 会 问 ， 为 什么 台式 计算 机 不 提供 足够 的 ROM 来 装载 整个 操作 系统 呢 ， 这 样 就 不 必 从 
海量 存储 器 来 引导 启动 了 。 虽 然 对 于 使 用 小 型 操作 系统 的 嵌入 式 系统 而 言 这 是 可 行 的 ， 但 就 当 
今 的 技术 而 言 ， 把 通用 计算 机 的 大 块 主 存 储 器 专用 于 非 易 失 性 的 存储 ， 效 率 就 不 高 了 。 男 一 方 
面 ， 计 算 机 操作 系统 要 频繁 地 进行 更 新 ， 以 确保 安全 性 并 与 改良 了 最 新 硬件 的 新 设备 驱动 程序 
同步 。 虽 然 也 有 可 能 去 更 新 存储 在 ROM 中 的 操作 系统 和 引导 装 入 程序 一 一 通常 称 为 固件 更 新 
(firmware update)， 但 技术 上 的 限制 使 得 海量 存储 器 成 为 了 较 传 统 的 计算 机 系统 的 最 普遍 选择 。 

最 后 ， 我 们 要 指出 ， 理 解 引导 过 程 ， 以 及 操作 系统 、 实 用 软件 和 应 用 软件 之 间 的 区 别 ， 能 
帮助 我 们 更 好 地 领会 大 多 数 通用 计算 机 操作 系统 的 运行 方法 。 当 这 样 的 机 器 第 一 次 开机 时 ， 引 
导 装 入 程序 会 装 入 并 激活 操作 系统 ， 然 后 用 户 向 操作 系统 提出 请 求 ， 执 行 实 用 程序 或 应 用 程序 。 
当 实 用 程序 或 应 用 程序 终止 时 ， 用 户 需 要 再 次 与 操作 系统 联系 ， 这 时 用 户 可 以 再 次 提出 请 求 。 
因此 ， 学 习 使 用 这 样 的 系统 是 一 个 双 层 过 程 ， 除 了 学 习 指 定 的 实用 程序 或 期 望 的 应 用 程序 的 细 
节 之 外 ， 还 必须 学 习 足 够 多 的 关于 机 器 操作 系统 的 知识 ， 这 样 才能 游 丸 有 余地 切换 应 用 程序 。 


问题 与 练习 


1. 列举 典型 操作 系统 的 组 件 ， 并 用 一 句 话 概括 每 个 组 件 的 作用 。 
2. 应 用 软件 与 实用 软件 之 间 的 区 别 是 什么 ? 

3. 什么 是 虚拟 存储 器 ? 

4. 概述 引导 过 程 。 
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3.3 协调 机 器 的 活动 | 


本 节 我 们 讨论 操作 系统 如 何 协调 应 用 软件 、 实 用 软件 以 及 操作 系统 自身 内 部 软件 单元 的 执 
行 。 首 先 ， 从 进程 的 概念 开始 。 


3.3.1 ”进程 的 概念 


现代 操作 系统 的 一 个 最 基本 概念 就 是 程序 与 执行 程序 的 活动 之 间 的 区 别 。 前 者 是 一 组 静态 的 
指令 ， 而 后 者 是 一 个 动态 的 活动 ， 其 属性 会 随 着 时 间 的 推进 而 改变 。( 我 们 可 以 把 程序 想象 成 插 
在 架子 上 一 本 书 里 的 一 页 乐谱 ， 而 把 活动 想象 成 用 行动 将 这 个 乐谱 描述 的 音乐 演奏 出 来 的 音乐 
家 。) 在 操作 系统 的 控制 下 执行 某 个 程序 的 活动 称 为 进程 (process)。 与 进程 联系 在 一 起 的 活动 的 当 
前 状态 称 为 进程 状态 (process state)。 这 个 状态 包含 正在 执行 的 程序 的 当前 位 置 (程序 计数 器 的 值 )、 
其 他 CPU 寄存 器 中 的 值 以 及 相关 的 存储 单元 。 大 约 说 来 ， 进 程 状态 就 是 机 器 在 特定 时 刻 的 快照 。 在 
程序 执行 期 间 的 不 同时 刻 一 个 进程 中 的 不 同时 刻 )， 将 观察 到 不 同 的 快照 〈 不 同 的 进程 状态 )。 

与 一 次 仅 尝试 演奏 一 部 音乐 作品 的 音乐 家 不 同 ， 典型 的 分 时 /多 任务 处 理 计算 机 通常 会 有 许 
多 进程 同时 运行 ， 并 且 所 有 进程 都 竞争 计算 机 资源 。 操 作 系 统 的 任务 就 是 管理 这 些 进程 ， 使 每 
个 进程 都 能 获得 其 需要 的 资源 (外 围 设备 、 主 存储 器 空间 、 对 文件 的 访问 以 及 对 CPU 的 访问 )， 
确保 独立 进程 不 会 相互 干扰 ， 确 保 需 要 交换 信息 的 进程 能 够 进行 信息 交换 。 


3.3.2 ”进程 管理 


与 协调 进程 的 执行 有 关 的 任务 是 由 操作 系统 内 核 中 的 调度 程序 和 分 派 程 序 处 理 的 。 调 度 程 
序 维护 一 个 有 关 计 算 机 系统 中 现存 进程 的 记录 (也 就 是 进程 池 ), 将 新 的 进程 加 入 到 该 进程 池 中 ， 
并 把 已 经 完成 的 进程 移出 进程 池 。 这 样 ， 当 用 户 请 求 执行 一 个 应 用 时 ， 调 度 程 序 就 把 这 个 应 用 
加 到 当前 进程 池 加 以 执行 。 

为 了 跟踪 所 有 的 进程 ， 调 度 程序 在 主 存储 器 中 维护 着 一 个 称 为 进程 表 (process table) 的 信 
息 块 。 每 当 要 请 求 程 序 执行 时 ， 调 度 程序 都 在 进程 表 中 为 该 程序 创建 一 个 新 的 表 项 。 这 个 表 项 
包含 有 如 分 配给 该 进程 的 存储 区 域 (从 内 存 管理 程序 得 到 )、 进 程 的 优先 级 以 及 该 进程 是 处 于 就 
绪 状 态 还 是 处 于 等 待 状态 这 样 的 信息 。 如 果 进 程 能 够 继续 执行 , 那么 该 进程 就 处 于 就 绪 (ready ) 
状态 ， 如 果 进 程 因 为 要 等 待 某 个 外 部 事件 〈 如 海量 存储 操作 的 完成 、 等 待 键盘 的 按键 或 者 等 待 
其 他 进程 传 来 的 消息 ) 的 发 生 而 延迟 ， 那 么 该 进程 就 处 于 等 待 waiting) 状态 。 

分 派 程序 是 内 核 的 一 个 组 件 , 它 确保 被 调度 的 进程 能 实际 执行 。 在 分 时 /多 任务 处 理 系 统 中 ， 
这 个 任务 是 依靠 多 道 程序 设计 (multiprogramming ) 来 完成 的 ， 也 就 是 说 ， 先 将 时 间 划 分 为 小 的 
时 间 段 ， 每 段 称 为 一 个 时 间 片 (time slice)， 通 常用 毫秒 (ms) 或 微 秒 〈hs) 来 计量 ， 然 后 把 
CPU 的 注意 力 放 在 就 绪 进程 上 ， 人 允许 每 个 进程 一 次 执行 一 个 时 间 片 〈 见 图 3-6)。 这 种 从 一 个 进 
程 到 另 一 个 进程 的 改变 过 程 称 为 进程 切换 (process switch ) 或 进程 上 下 文 切 换 (context switch ) 。 

每 次 分 派 程 序 给 进程 分 配 一 个 时 间 片 ， 它 都 会 初始 化 一 个 计时 器 电路 ， 通 过 产生 一 个 中 断 
Cinterrupt) 信号 来 指示 时 间 片 的 结束 。CPU 对 这 个 中 断 信 号 的 反应 ， 与 你 的 任务 被 中 断 时 的 反 
应 大 致 相同 。 你 被 中 断 时 ， 会 停止 当时 正在 做 的 工作 ， 记 录 当 时 任务 进展 的 位 置 〈 这 样 就 能 在 
以 后 返回 到 这 个 位 置 )， 然 后 处 理 中 断 事 件 。 当 CPU 收 到 一 个 中 断 信号 时 ， 它 会 完成 当前 的 机 器 
周期 ， 保 存 它 在 当前 进程 中 的 位 置 ， 然 后 开始 执行 中 断 处 理 程序 (interrupt handler)， 该 程序 存 
储 在 主 存储 器 中 预先 定义 的 位 置 上 。 中 断 处 理 程序 是 分 派 程序 的 一 部 分 ， 它 用 来 描述 分 派 程序 
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如 何 响应 中 断 信 号 。 






进程 切换 进程 切换 





时 间 片 时 间 片 时 间 片 时 间 片 
图 3-6 ”进程 A 与 进程 B 之 间 的 多 道 程序 设计 





Re 正如 文中 描述 的 那样 ， FE 
的 一 个 。 有 许多 可 以 产生 中 断 信号 的 环境 ， 每 个 都 有 自己 的 中 断 例 程 。 事 实 上 ， 中 断 为 协调 
计算 机 的 活动 与 相关 环境 提供 了 一 个 重要 的 工具 。 全 各 单 吉 失 标 和 技 下 锭 相册 的 谷村 全 
都 能 产生 中 断 信 号 ， 使 CPU 放下 正在 处 理 的 工作 ， 转 而 去 解决 中 断 。 

关子 管理 识 副 和 响应 中 断 的 任务 ;不 同 的 中 靳 性 囊 攻 导 下 了 不 同 的 氏 抑 经) 村 术 最 要 
的 任务 能 够 得 到 优先 处 理 。 最 高 级 别 的 中 断 通常 与 电源 故障 有 关 ， 像 计算 机 电源 意外 中 断 而 
产生 的 中 断 信号 ， 相 关 的 中 断 例 程 会 赶 在 电压 降 到 不 能 再 进行 操作 前 的 几 毫秒 时 间 内 ， 引导 
CPU 完成 一 系列 的 “内 务 ” 琐 事 。 


于 是 ， 中 断 信 号 的 作用 就 是 抢占 当前 进程 ， 将 控制 权 传 回 分 派 程序 。 此 时 ， 分 派 程序 从 进 
程 表 的 就 绪 进 程 中 选择 优先 级 最 高 的 进程 《由 调度 程序 决定 )， 重 启 计 时 器 电路 ， 使 被 选择 的 进 
程 开 始 它 的 时 间 片 加 以 执行 。 

多 道 程序 设计 系统 能 够 成 功 的 最 大 关键 是 能 够 停止 并 在 稍 后 重启 一 个 进程 。 如 果 你 在 读 一 
本 书 的 时 候 被 打 断 了 ， 那 么 你 能 否 在 稍 后 继续 阅读 就 取决 于 你 是 否 记得 中 断 时 读 到 的 位 置 ， 以 

及 那个 位 置 之 前 的 信息 。 简 而 言 之 ， 你 必须 能 够 重新 建立 起 中 断 前 的 那个 环境 。 

在 一 个 进程 的 情况 下 ， 必 须 重 新 建立 的 环境 就 是 该 进程 的 状态 ， 前 面 提 到 过 ， 这 个 状态 包 
括 程 序 计数 器 的 值 以 及 寄存 器 和 相关 存储 单元 的 值 。 在 为 多 道 程 序 设计 系统 开发 的 CPU 中 ， 保 
存 这 种 信息 的 任务 是 CPU 对 中 断 信号 反应 的 一 部 分 。 这 类 CPU 还 提供 机 器 语言 指令 ， 以 重新 装 
入 先前 保存 的 状态 。 这 种 特性 简化 了 分 派 程序 执行 进程 切换 时 的 任务 ， 它 也 例证 了 现代 的 CPU 
设计 是 如 何 受 当今 操作 系统 的 需求 影响 的 。 

最 后 ， 我 们 应 当 注 意 到 ， 多 道 程序 设计 的 使 用 提高 了 机 器 的 总 体 效率 。 这 有 点 违反 直觉 ， 
因为 多 道 程序 设计 对 进程 的 来 回 切换 会 产生 开销 。 但 是 ， 如 果 没 有 多 道 程序 设计 处 理 技术 ， 每 
个 进程 都 要 运行 到 完成 才能 开始 下 一 个 进程 的 话 ， 就 意味 着 进程 等 待 外 围 设备 来 完成 任务 的 时 
间 ， 或 者 等 待 用 户 发 出 下 一 个 请 求 的 时 间 被 浪费 了 。 多 道 程 序 设计 技术 可 以 把 这 些 浪费 的 时 间 
给 另 一 个 进程 。 例 如 ， 如 果 一 个 进程 执行 一 个 /O 请 求 ， 如 向 磁盘 提出 读数 据 请 求 ， 那 么 调度 程 
序 就 会 更 新 进程 表 来 反映 出 这 个 进程 正在 等 待 外 部 事件 。 结 果 是 ， 分 派 程序 将 不 再 给 该 进程 分 
配 时 间 片 。 之 后 (也 许 是 几 百 毫秒 )， 当 这 个 WO 请 求 完 成 时 ， 调 度 程序 将 会 更 新 进程 表 来 显示 
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该 进程 处 于 就 绪 状 态 ， 这 样 这 个 进程 就 可 以 重新 竞争 时 间 片 了 。 简 而 言 之 ， 当 IO 请 求 正在 执行 
时 ， 其 他 任务 就 会 被 执行 ， 因 此 一 组 任务 的 完成 时 间 要 比 按照 顺序 方式 执行 所 花 的 时 间 少 。 


问题 与 练习 

1. 概述 程序 和 进程 的 差别 。 

2. 概述 在 中 断 出 现时 ，CPU 要 完成 哪些 步骤 。 

3. 在 多 道 程序 设计 系统 中 ， 如 何 能 使 高 优先 级 的 进程 运行 得 比 其 他 进程 快 ? 

4. 在 一 个 多 道 程序 设计 系统 里 ， 如 果 每 个 时 间 片 是 50 ms， 每 次 上 下 文 切换 所 花费 的 时 间 最 多 是 1 hs， 那 
么 机 器 在 1 s 内 能 够 服务 多 少 个 进程 ? 

5. 在 问题 4 中 ， 如 果 每 个 进程 都 完全 使 用 了 它 的 时 间 片 ， 那 么 实际 花费 在 进程 执行 上 的 时 间 占 整个 机 器 
时 间 的 比例 是 多 少 ? 如 果 每 个 进程 在 它 的 时 间 片 后 的 1 hs 执行 WO 请 求 ， 那 么 这 个 比例 又 是 多 少 ? 


a 
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操作 系统 的 一 个 重要 任务 就 是 将 机 器 的 各 种 资源 分 配给 系统 中 的 各 个 进程 。 从 广义 上 讲 ， 
我 们 所 用 的 资源 (resource) 这 个 术语 ， 不 仅 包 括 机 器 的 外 围 设备 ， 还 包括 机 器 本 身 的 特性 。 文 
件 管 理 程序 分 配对 文件 的 访问 ， 并 为 新 文件 的 建立 分 配 海量 存储 空间 ， 内 存 管理 程序 分 配 内 存 空 
间 ， 调 度 程序 分 配 进程 表 中 的 空间 ， 分 派 程 序 分 配 时间 片 。 正 如 计算 机 系统 里 的 许多 问题 一 样 ， 
这 种 分 配 任务 表面 上 看 起 来 很 简单 ， 但 实际 上 ， 对 于 一 个 设计 不 佳 的 操作 系统 ， 几 个 微小 的 错误 
就 将 导致 系统 失灵 。 要 记 住 ， 机 器 不 会 自己 思考 ， 它 仅仅 是 遵照 指令 办 事 。 因 此 ， 为 了 构建 一 个 
可 靠 的 操作 系统 ， 我 们 必须 设计 算法 克服 各 种 可 能 出 现 的 意外 情况 ， 不 管 它 出 现 的 概率 有 多 小 。 


3.4.1 ”信和 号 量 


让 我 们 来 考虑 一 个 分 时 /多 任务 处 理 操作 系统 ， 它 控制 只 有 一 台 打 印 机 的 计算 机 的 活动 。 如 
果 一 个 进程 需要 打印 它 的 结果 ， 那 么 它 必须 向 操作 系统 提出 请 求 ， 要 求 访问 打印 机 的 设备 驱动 
程序 。 这 个 时 候 , 操作 系统 必须 根据 该 打印 机 是 否 被 另 一 个 进程 占用 来 决定 是 否 批准 这 个 请 求 。 
如 果 没 有 被 占用 ， 那 么 操作 系统 应 该 批准 这 个 请 求 ， 并 允许 该 进程 继续 执行 ， 否 则 ， 操 作 系 统 
应 当 拒绝 这 个 请 求 ， 或 者 把 这 个 进程 归 类 为 等 待 进程 ， 直 到 打印 机 可 用 为 止 。 毕 竟 ， 如 果 两 个 
进程 同时 获得 对 打印 机 的 访问 权 ， 那 么 结果 对 两 者 都 将 室 无 用 处 。 

为 了 控制 对 打印 机 的 访问 ， 操 作 系 统 必须 跟踪 打印 机 是 否 已 经 被 分 配 。 解 决 这 个 任务 的 一 
种 方法 是 使 用 一 个 标志 ， 在 这 里 ， 它 指 存储 器 中 的 一 个 位 ， 其 状态 通常 是 指 置 位 〈set) 和 清 堆 
《clear)， 而 不 是 1 和 0。 清 零 标志 《〈 值 为 0) 表示 打印 机 可 用 ， 置 位 标志 《〈 值 为 1) 表示 打印 机 当 
前 已 经 分 配 出 去 了 。 表 面 上 看 ， 这 种 方法 似乎 可 行 。 每 次 访问 打印 机 的 一 个 请 求 到 来 时 ， 操 作 
系统 要 做 的 工作 仅仅 是 检查 这 个 标志 位 。 如 果 是 清 零 标志 位 ， 那 么 操作 系统 就 批准 该 请 求 ， 同 
时 对 标志 位 进行 置 位 。 如 果 是 置 位 标志 位 ， 操 作 系统 就 将 请 求 进程 放 入 等 待 队列 中 。 每 当 一 个 
进程 完成 了 访问 打印 机 的 任务 , 操作 系统 就 将 打印 机 分 配给 一 个 等 待 进 程 , 在 没有 等 待 进程 时 ， 
将 这 个 标志 清 零 。 
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。 通过 执行 “任务 管理 器 ”这 个 实用 程序 (同时 接 下 Cl、Alt 和 Delete 键 ) 你 可 以 深入 了 
解 微软 Windows 操 作 系统 的 内 部 活动 。 特 别 地 ， 通 过 选择 “任务 管理 器 ”窗口 的 “进程 ， 选 
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项 卡 ， 你 可 以 看 到 进程 表 。 这 里 你 可 以 做 一 个 试验 : 在 激活 任何 应 用 程序 之 前 ， 看 一 下 进程 
表 ， (你 也 许 会 惊讶 于 表 中 已 经 有 了 如 此 多 的 进程 ， 它 们 都 是 系统 基本 操作 所 必需 的 . ) 现 
在 激活 一 个 应 用 ， 并 且 确认 一 个 新 进程 已 经 进入 到 表 中 。 你 还 能 够 看 到 该 进程 分 配 到 了 多 
少 内 存 空间 . 


然而 ， 这 个 简单 的 标志 系统 还 是 有 个 问题 。 测 试 任务 和 可 能 有 的 标志 置 位 任务 也 许 需 要 几 
条 机 器 指令 。( 从 主 存储 器 检索 到 标志 的 值 ， 在 CPU 中 操控 ， 最 终 存 回 主 存储 器 。) 因此 ， 在 检 
测 到 清 堆 标志 之 后 、 标 志 被 置 位 之 前 ， 这 个 任务 有 可 能 被 中 断 。 有 具体 而 言 ， 假 设 这 个 打印 机 当 
前 是 可 用 的 ， 且 一 个 进程 请 求 它 的 使 用 权 。 从 主 存储 器 中 检索 到 标志 ， 而 且 发 现 它 已 清 零 ， 表 
示 该 打印 机 可 用 。 但 是 ， 在 这 个 时 候 这 个 进程 被 中 断 了 ， 男 一 个 进程 开始 了 它 的 时 间 片 ， 它 也 
请 求 打印 机 的 使 用 权 。 于 是 再 一 次 从 主 存 检索 标志 ， 发 现 它 仍 是 清 零 的 ， 因 为 前 一 个 进程 在 操 
作 系 统 有 时 间 将 主 存储 器 中 的 标志 置 位 之 前 被 中 断 了 。 因 此 ， 操 作 系 统 允 许 第 二 个 进程 开始 使 
用 打印 机 。 过 后 ， 第 一 个 进程 在 它 被 中 断 的 地 方 恢 复 执行 ， 那 个 地 方正 是 操作 系统 发 现 标 志 
清 零 的 地 方 。 于 是 ， 操 作 系统 继续 对 主 存储 器 中 的 标志 置 位 并 允许 第 一 个 进程 访问 打印 机 。 现 
在 ， 这 两 个 进程 在 使 用 同一 台 打 印 机 。 

这 个 问题 的 解决 办 法 就 是 ， 要 坚持 让 测试 任务 和 可 能 有 的 标志 置 位 任务 必须 在 没有 中 断 的 
条 件 下 完成 。 一 种 方法 是 使 用 大 多 数 机 器 语言 都 提供 的 禁止 中 断 指令 和 允许 中 断 指 令 。 在 执行 
时 ， 禁 止 中 断 指 令 能 锁定 未 来 的 中 断 ， 而 允许 中 断 指 令 能 使 CPU 恢复 对 中 断 信号 的 响应 。 于 是 ， 
如 果 操 作 系统 用 禁止 中 断 指 令 开始 一 个 标志 测试 例 程 ， 并 以 允许 中 断 指 令 结束 ， 那 么 该 例 程 一 
且 开 始 就 不 会 有 其 他 活动 中 断 它 。 

男 一 种 方法 是 使 用 许多 机 器 语言 里 都 可 用 的 测试 并 置 位 (test-and-set) 指令 。 这 条 指令 要 求 
CPU 检 索 一 个 标志 的 值 ， 记 录 接 收 到 的 值 ， 然 后 置 位 该 标志 一 一 所 有 这 些 工 作 都 在 一 条 机 器 指 
令 内 完成 。 它 的 优点 是 ， 因 为 CPU 在 辨认 一 个 中 断 之 前 必须 完成 当前 的 指令 ， 所 以 测试 和 标志 
置 位 任务 作为 一 条 指令 实现 时 不 可 能 被 分 割 。 

刚才 描述 的 一 个 正确 实现 的 标志 称 为 信号 量 (semaphore)， 它 源 自 于 控制 轨道 区 段 使 用 的 
铁路 信号 机 。 事 实 上 ， 信 和 号 量 在 软件 系统 里 的 用 法 与 信号 机 在 铁路 系统 里 的 用 法 是 一 样 的 。 就 
像 一 个 轨道 区 段 一 次 只 能 有 一 列 列 车 通过 ， 一 个 指令 序列 一 次 也 上 只 能 由 一 个 进程 执行 。 这 样 的 
一 个 指令 序列 称 为 临界 区 (critical region)。 这 种 一 次 只 允许 一 个 进程 执行 一 个 临界 区 的 要 求 称 
为 互 斥 Cmutual exclusion )。 概 括 地 说 ， 获 得 对 一 个 临界 区 的 互 斥 的 常用 办 法 是 用 一 个 信号 量 守 
护 这 个 临界 区 。 一 个 进程 要 进 这 个 临界 区 ， 必 须 确定 这 个 信号 量 是 清 零 的 ， 并 在 进入 临界 区 之 
前 把 它 置 位 ， 然 后 在 出 临界 区 时 把 这 个 信号 量 清 零 。 如 果 发 现 这 个 信号 量 在 置 位 状态 ， 那 么 试 
图 进入 临界 区 的 进程 必须 等 待 ， 直 到 这 个 信号 量 被 清 零 。 


3.4.2 ” 死 锁 


在 资源 分 配 中 可 能 发 生 的 另 一 个 问题 是 死 锁 (deadlock)。 在 死 锁 状态 下 ， 两 个 或 更 多 的 进 
程 被 阻塞 ， 不 能 继续 执行 ， 因 为 它们 中 的 每 一 个 都 在 等 待 已 分 配给 男 一 个 的 资源 。 例 如 ， 一 个 
进程 可 能 已 有 对 计算 机 打印 机 的 访问 权 ， 同时 它 还 在 等 待 访问 这 台 计 算 机 的 CD 播放 器 ， 而 另 一 
个 进程 有 CD 播放 器 的 访问 权 , 却 在 等 待 访问 打印 机 。 男 一 个 例子 出 现在 允许 进程 创建 新 进程 [这 
种 动作 在 UNIX 术 语 中 称 为 派生 (forking)」 来 完成 子 任务 的 系统 里 。 如 果 调 度 程序 因为 进程 表 
没有 空间 而 无 法 创建 新 进程 ， 同 时 系统 里 的 每 个 进程 又 都 必须 创建 额外 的 进程 才能 完成 任务 ， 
那么 没有 一 个 进程 可 以 继续 。 这 种 情况 和 其 他 环境 下 的 情况 一 样 〈 见 图 3-7)， 会 严重 降低 系统 


性 能 。 
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图 3-7 ”由 于 竞争 不 可 共享 的 铁路 区 上 段 造成 的 死 锁 


对 死 锁 的 分 析 表 明 ， 只 有 以 下 3 个 条 件 全 部 满足 它 才 会 出 现 。 

(1) 存在 对 不 可 共享 资源 的 竞争 。 

(2) 这 些 资源 是 在 不 完整 的 基础 上 请 求 的 ， 也 就 是 说 ， 一 个 进程 接受 了 某 些 资源 后 ， 稍 后 
还 将 请 求 其 他 的 资源 。 

(3) 一 个 资源 一 旦 被 分 配 出 去 ， 就 不 能 以 强制 的 办 法 再 收回 。 

分 离 出 这 些 条 件 的 意义 在 于 ， 只 要 努力 抑制 这 三 个 条 件 当 中 的 任何 一 个 ， 就 可 以 避免 出 现 
死 锁 问题 。 着 力 于 抑制 第 三 个 条 件 的 技术 被 称 为 死 锁 检测 和 改正 方案 。 在 这 些 情况 下 ， 死 锁 状 
态 被 认为 不 大 容易 出 现 ， 因 而 不 必 特 别 采取 办 法 避免 死 锁 ,而 只 是 在 死 锁 出 现 的 时 候 检 测 出 它 ， 
然后 通过 强制 性 收回 某 些 已 经 分 配 出 去 的 资源 来 改正 它 。 进 程 表 已 满 就 属于 这 种 情况 。 如 果 死 
锁 是 由 于 进程 表 满 产生 的 ， 那 么 操作 系统 中 的 例 程 或 人 类 管理 员 利用 其 “超级 用 户 * 的 特权 ) 
可 以 移 除 [专业 术语 是 杀 死 〈kill)] 一 些 进程 ， 释 放 一 些 进程 表 的 空间 ， 打 破 死 锁 并 使 得 剩 下 
的 进程 可 以 继续 它们 的 任务 。 

着 力 于 抑制 前 两 个 条 件 的 技术 ， 一 般 被 称 为 死 锁 避免 方案 。 例 如 ， 针 对 上 述 第 二 个 条 件 的 
一 个 方法 是 要 求 每 个 进程 一 次 性 请 求 它 所 需要 的 全 部 资源 。 另 一 个 针对 第 一 个 条 件 的 方案 ， 不 
是 直接 移 除 竞争 ， 而 是 把 不 可 共享 的 资源 转变 为 可 共享 的 资源 。 例 如 ， 假 定 出 问题 的 资源 是 打 
印 机 ， 各 种 进程 都 请 求 使 用 它 。 每 当 一 个 进程 请 求 打印 机 时 ， 操 作 系 统 都 会 批准 这 个 请 求 。 但 
是 ， 操 作 系统 不 是 把 这 个 进程 连接 到 打印 机 的 设备 驱动 程序 上 ， 而 是 连接 到 一 个 设备 驱动 程序 
上 ， 该 驱动 程序 把 要 打印 的 信息 存储 在 海量 存储 器 上 ， 而 不 把 它 发 送 到 打印 机 上 。 于 是 ， 每 个 
进程 都 认为 它 访问 了 打印 机 ， 能 正常 工作 。 以 后 ， 当 打印 机 可 用 时 ， 操 作 系 统 可 以 把 数据 从 海 
量 存储 器 传送 到 打印 机 。 按 照 这 个 方法 ， 操 作 系统 通过 建立 有 多 个 打印 机 的 假象 把 不 可 共享 的 
资源 变 成 了 好 像 是 可 共享 的 。 这 种 保存 数据 供 以 后 在 合适 的 时 候 输出 的 技术 称 为 假 脱 机 
(spooling )。 





当 一 个 用 户 执行 一 个 Python 脚 本 时 ， 操作 系统 会 启动 一 个 新 进程 来 运行 这 个 脚本 。 这 种 脚本 
通常 是 应 用 软件 ， 但 如 果 它 们 扩展 或 定制 了 系统 的 功能 ， 也 可 以 被 视 为 实用 软件 。 Python 脚本 通 
过 与 操作 系统 组 件 《如 读 写 文件 的 文件 管理 器 或 者 提供 用 户 交互 的 GUI 或 shell ) 的 交互 来 完成 它 
们 的 工作 。Python 模 块 “os” 提 供 了 各 种 预定 义 的 、 系 统 无 关 的 ( system-a 





问 通 用 操作 系统 的 特性 ， 如 派生 新 的 Python 进程 ， ee 
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“人 让 全 时 放生 考 素 理 基 可 道 过 以 估计 入 本 二 大 机 过 生 全 让 让 全 全 全 六 于 沿革 帮 生 
多 个 进程 的 假象 。 现 代 系 统 继续 通过 这 种 方式 实现 多 任务 处 理 ， 但 最 新 的 多 核 CPU 确 实 能 够 
同时 运行 2 个 、4 个 或 更 多 个 进程 。 与 一 组 协同 工作 的 单 核 计算 机 不 同 ， 一 台 多 核 机 器 包含 多 
个 独立 的 处 理 器 ( 称 为 核 )， 它 们 共享 计算 机 的 外 围 设备 、 内 存 等 资源 。 对 于 一 个 多 核 操作 系 
统 ， 这 意味 着 分 派 程序 和 调度 程序 必须 考虑 在 每 个 核 上 应 该 执行 哪些 进程 。 随 着 不 同 的 进程 
运行 于 不 同 的 核 上 ， 进 程 间 的 处 理 竟 争 变 得 更 具有 挑战 性 ， 因 为 每 当 一 个 进程 需要 进入 临界 
区 时 ， 所 有 核 上 都 会 禁用 中 断 ， 但 这 种 做 法 效率 极 低 。 构 建 能 更 好 地 适应 新 的 多 核 环 境 的 操 
作 系 统 机 制 ， 是 计算 机 科学 中 比较 活跃 的 研究 方向 。 


假 脱 机 是 一 种 允许 多 个 进程 访问 一 个 公共 资源 的 技术 ， 它 可 以 有 许多 变 体 。 例 如 ， 文 件 管 
理 程序 可 以 批准 若干 个 进程 访问 同一 个 文件 ， 前 提 是 它们 只 是 从 该 文件 读 取 数据 ， 但 是 如 果 多 
个 进程 试图 同时 更 改 一 个 文件 就 会 发 生 冲 突 。 于 是 ， 文 件 管理 程序 可 以 根据 进程 的 需要 分 配对 
文件 的 访问 权限 ， 人 允许 若干 个 进程 有 读 访问 权 ， 但 在 任何 给 定时 刻 只 有 一 个 进程 有 写 访问 权 。 
其 他 的 系统 可 能 把 这 种 文件 分 成 区 段 ， 使 得 不 同 的 进程 可 以 并 发 地 更 改 文件 的 不 同 部 分 。 然 而 ， 
其 中 每 一 项 技术 要 得 到 一 个 可 靠 的 系统 ， 都 有 一 些 必须 解决 的 微妙 问题 。 例 如 ， 当 有 写 访问 权 
的 进程 更 改 了 这 个 文件 时 ， 如 何 通知 那些 只 有 读 访 问 权 的 进程 呢 ? 


问题 与 练习 


1. 假定 进程 A 和 B 共 享 同一 台 机 器 的 时 间 , 并且 每 个 进程 都 需要 短 时 间 使 用 同一 个 不 可 共享 的 资源 。( 例 
如 ， 每 个 进程 可 能 都 打印 一 系列 独立 的 短 报告 。) 每 个 进程 可 能 都 重复 地 获得 这 个 资源 ， 释 放 它 ， 稍 
后 又 再 次 请 求 它 。 按 照 下 面 的 方法 控制 对 该 资源 的 访问 存在 什么 缺点 ? 

开始 时 ， 给 一 个 标志 赋予 值 0。 如 果 进 程 A 请 求 这 个 资源 并 且 该 标志 为 0， 那 么 就 批准 这 个 
请 求 ; 否则 使 进程 A 处 于 等 待 状态 。 如 果 进 程 B 请 求 这 个 资源 并 且 该 标志 为 1， 那 么 就 批准 

这 个 请 求 ; 否则 使 进程 B 处 于 等 待 状态 。 每 当 进 程 A 完成 对 这 个 资源 的 访问 ,就 把 标志 变 为 

1。 每 当 进 程 B 完 成 对 这 个 资源 的 访问 ， 就 把 标志 变 为 0， 

2. 假定 一 条 双 车 道 的 道路 在 过 隧道 时 合并 为 一 个 车 道 。 为 了 协调 这 个 隧道 的 使 用 ， 安 装 了 下 述 信号 系统 : 

一 辆 汽车 无 论 从 哪个 入 口 进 入 隧道 ， 隧 道 入 口 处 上 方 的 红 灯 都 会 被 打开 。 当 这 辆 汽车 离开 隧道 
时 ， 红 灯会 被 关闭 。 如 果 一 辆 到 达 的 汽车 发 现 红 灯 是 开 着 的 ， 那 么 它 就 要 等 待 ， 直 到 红 灯 关 闭 

时 才能 进入 隧道 。 

这 个 系统 存在 什么 缺陷 ? 

3. 为 了 解决 单行 桥 上 两 辆 汽车 相遇 的 死 锁 问题 , 假设 已 提出 下 面 几 个 解决 方案 。 说 明 每 个 解决 方案 各 消 
除了 前 文中 提 到 的 3 个 死 锁 条 件 中 的 哪 一 个 。 
a. 在 桥 上 变 空 之 前 不 允许 汽车 上 桥 。 

b. 如 果 两 辆 汽车 相遇 ， 让 其 中 一 辆 倒退 。 
c. 为 这 座 桥 添加 第 二 个 车 道 。 

4. 假定 我 们 用 圆 点 表示 多 道 程序 设计 系统 中 的 每 一 个 进程 , 从 第 一 个 圆 点 到 第 二 个 圆 点 的 箭头 表示 第 一 
个 〈 圆 点 所 表示 的 ) 进程 正在 等 待 第 二 个 〈 圆 点 所 表示 的 ) 进程 正在 使 用 的 〈 非 共享 ) 资源 。 数 学 家 
把 得 到 的 这 种 图 称 为 有 向 图 〈directed graph)。 有 向 图 的 什么 性 质 等 价 于 操作 系统 的 死 锁 问题 ? 


3.5 安全 性 
由 于 操作 系统 监督 着 计算 机 的 活动 ， 很 自然 ， 它 在 维护 安全 性 方面 也 起 了 重要 的 作用 。 从 
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广义 上 说 ， 这 种 责任 本 身 也 有 多 种 表现 形式 ， 可 靠 性 就 是 其 中 一 种 。 如 果 文 件 管理 程序 的 缺陷 
使 得 一 个 文件 的 一 部 分 丢失 了 ， 那 么 这 个 文件 就 是 不 安全 的 。 如 果 一 个 分 派 程序 里 的 缺陷 导致 
系统 故障 (通常 称 为 系统 朋 省 )， 使 得 一 小 时 的 打字 工作 白费 了 ， 那 么 我 们 会 说 ,产品 是 不 安全 
的 。 因 此 ， 计 算 机 系统 的 安全 性 需要 一 个 精心 设计 的 可 信赖 的 操作 系统 。 

可 靠 软件 的 开发 不 再 受制 于 操作 系统 ， 它 贯穿 于 整个 软件 的 开发 过 程 ， 在 计算 机 科学 里 称 为 
软件 工程 ， 我 们 将 在 第 7 章 讨论 这 个 论题 。 在 本 节 ， 我 们 集中 讨论 与 操作 系统 息息相关 的 安全 性 
问题 。 


3.5.1 来 自 外 部 的 攻击 


操作 系统 的 一 个 重要 任务 就 是 ， 保 护 计算 机 的 资源 不 被 未 授权 用 户 访问 。 在 多 个 人 使 用 计 
算 机 的 时 候 ， 操 作 系 统一 般 会 通过 为 不 同 的 授权 用 户 建立 “账户 ”的 方法 来 标记 不 同 权 限 的 用 
户 。 账 户 实际 上 是 包含 了 授予 该 用 户 的 诸如 用 户 名 、 口 令 和 权限 等 条 目的 记录 。 操 作 系统 在 每 
个 登录 (login) 过 程 (一 个 事务 序列 ， 在 这 个 过 程 中 ， 用 户 建立 与 计算 机 操作 系统 的 初步 联系 ) 
中 使 用 这 些 信 息 控 制 用 户 对 系统 的 访问 权限 。 

账户 由 一 个 称 为 超级 用 户 (super user) 或 管理 员 (administrator) 的 人 创建 。 这 个 人 通过 将 
自己 标识 为 管理 员 (通常 是 通过 用 户 名 和 口令 )， 享有 对 操作 系统 的 高 度 访问 特权 。 这 个 联系 一 
旦 建立 ,管理 员 就 可 以 更 改 操作 系统 内 的 设置 、 修 改 关键 的 软件 包 、 调 整 其 他 用 户 访问 系统 的 
权限 ， 进 行 一 般 用 户 不 能 进行 的 各 种 活动 。 

通过 这 种 “ 极 高 的 高 位 ”， 管 理 员 能 够 监视 计算 机 系统 中 的 活动 ,检测 到 恶意 的 或 者 偶然 的 
破坏 行为 。 为 了 协助 监视 ， 人 们 开发 了 大 量 称 为 审计 软件 (auditing software) 的 软件 实用 程序 ， 
来 记录 和 分 析 发 生 在 计算 机 系统 内 的 活动 。 特 别 地 ， 审 计 软 件 可 以 揭露 许多 试图 用 错误 的 口令 
登录 系统 的 活动 ， 指 出 一 个 未 授权 用 户 正 在 试图 获取 计算 机 的 访问 权 。 审 计 软 件 还 可 以 识别 用 
户 账户 中 与 该 用 户 以 往 行为 不 一 致 的 活动 ， 这 可 能 表明 一 个 未 授权 用 户 访问 了 这 个 账户 。( 以 下 
这 样 的 事情 不 太 可 能 发 生 : 一 个 用 户 ， 以 前 仅仅 使 用 文字 处 理 软件 和 电子 制 表 软 件 ， 突 然 开始 
访问 技术 性 很 强 的 软件 应 用 ， 或 者 试图 执行 超出 其 用 户 权 限 的 实用 程序 包 。) 

设计 审计 软件 的 另外 一 个 目的 是 检测 嗅 探 软 件 〈sniffing software)， 这 种 软件 在 计算 机 上 运 
行 时 能 够 记录 活动 并 在 稍 后 将 之 报告 给 潜在 的 入 侵 者 。 一 个 老 的 众所周知 的 例子 是 一 个 能 够 模 
拟 操 作 系 统 登录 过 程 的 程序 。 这 样 的 一 个 程序 可 以 用 来 欺骗 操作 系统 的 授权 用 户 ， 使 他 们 认为 
自己 是 在 和 操作 系统 通信 ， 然 而 ， 实 际 上 他 们 是 在 把 自己 的 用 户 名 和 口令 提供 给 骗子 。 

在 所 有 与 计算 机 安全 相关 的 技术 复杂 性 上 ， 让 很 多 人 感到 吃惊 的 是 ， 计 算 机 系统 安全 性 的 
其 中 一 个 主要 障碍 居然 是 用 户 自 己 的 粗心 大 意 。 例 如 ， 用 户 选择 的 口令 相对 比较 容易 猜 〈 如 名 
字 和 日 期 ); 与 朋友 共享 自己 的 口令 ; 没有 及 时 更 换 自 己 的 口令 ; 将 自己 的 离线 海量 存储 设备 在 
机 器 间 来 回 地 转移 ， 这 样 就 淤 在 地 降低 了 其 安全 性 ;在 计算 机 系统 中 安装 未 经 认可 的 可 能 会 损 
坏 系 统 安全 性 的 软件 。 对 于 类 似 这 样 的 问题 , 大 多 数 使 用 大 型 计算 机 的 机 构 都 采用 强制 的 策略 ， 
明文 规定 用 户 的 需求 和 职责 。 


3.5.2 来 自 内 部 的 攻击 


一 旦 潜行 者 〈 也 可 能 是 怀 有 恶意 的 授权 用 户 ) 获得 了 计算 机 系统 的 访问 权限 ， 那 么 他 们 下 
一 步 的 工作 通常 是 浏览 机 器 ， 寻 找 其 感 兴趣 的 信息 或 者 是 插入 破坏 性 软件 的 地 方 。 如 果 一 个 潜 
行者 获取 了 系统 的 管理 员 账号 ， 那 么 上 述 事 情 就 很 容易 做 到 ， 这 也 是 我 们 为 什么 要 严格 保护 好 
管理 员 口 令 的 原因 。 然 而 ， 如 果 是 通过 普通 用 户 账 号 进行 访问 ， 那 么 潜行 者 必然 会 欺骗 操作 系 
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统 ， 以 获得 未 授予 该 用 户 的 权限 。 例 如 ， 洪 行者 会 尝试 着 欺骗 内 存 管 理 程序 ， 让 一 个 进程 访问 
其 被 分 配 的 存储 区 以 外 的 内 存 区 域 ， 或 者 欺骗 文件 管理 程序 ， 访 问 本 应 该 被 拒绝 访问 的 文件 。 

现在 的 CPU 在 设计 时 已 经 加 强 了 一 些 功能 ， 能 够 阻止 上 面谈 到 的 攻击 尝试 。 举 一 个 例子 来 
说 ， 我 们 可 以 考虑 这 样 一 个 需求 : 通过 内 存 管理 程序 ， 将 进程 限制 在 给 它 分 配 的 主 存储 器 区 域 
内 。 如 果 没 有 这 样 的 限制 ， 一 个 进程 就 能 够 从 主 存 储 器 中 擦 除 操作 系统 ， 从 而 接管 对 计算 机 的 
控制 。 为 了 应 对 这 样 的 尝试 ， 为 多 道 程 序 设计 系统 设计 的 CPU 通常 包括 若干 个 专用 寄存 器 ， 操 
作 系统 可 以 在 这 些 寄存 器 中 存储 分 配给 一 个 进程 的 存储 区 域 的 上 下 界 。 于 是 ， 当 执行 该 进程 时 ， 
CPU 把 每 个 存储 器 引用 与 这 些 寄存 器 中 的 值 进行 比较 ， 以 确保 该 引用 在 指定 的 界限 之 内 。 如 果 
发 现 这 个 引用 在 为 该 进程 指定 的 区 域 之 外 ，CPU 将 自动 把 控制 权 交 还 给 操作 系统 〈 借 助 于 中 断 
处 理 )， 这 样 操 作 系统 可 以 采取 适当 的 行动 。 

这 个 方案 中 还 存在 一 个 小 的 但 很 重要 的 问题 。 如 果 没 有 进一步 的 安全 特性 ， 一 个 进程 还 是 
能 够 访问 指定 区 域 以 外 的 存储 单元 ， 只 要 改变 含有 存储 区 界限 的 专用 寄存 器 的 值 即 可 。 也 就 是 
说 ， 一 个 进程 想 要 访问 更 多 的 内 存 区 域 ， 它 只 需要 增加 存放 存储 区 域 上 界 的 寄存 器 的 值 ， 然 后 
不 需要 得 到 操作 系统 的 批准 ， 就 可 以 使 用 这 些 额 外 的 存储 空间 。 

为 了 防止 这 样 的 行为 ， 将 多 道 程序 设计 系统 的 CPU 设 计 为 工作 在 两 种 特权 级 别 
(privilege level) 之 一 的 模式 下 ; 我 们 将 其 中 之 一 称 为 “有 特权 模式 ”而 另外 一 个 称 为 “无 
特权 模式 ”。 当 处 在 有 特权 模式 下 时 ，CPU 能 够 用 自己 的 机 器 语言 处 理 所 有 的 指令 ， 但 处 
在 无 特权 模式 下 时 ， 能 够 接受 的 指令 就 是 有 限 的 。 这 种 仅 在 有 特权 模式 下 可 用 的 指令 ， 我 
们 称 为 特权 指令 (privileged instruction)。( 典 型 的 有 特权 指令 有 : 改变 内 存 界 限 寄存 器 的 
内 容 的 指令 和 改变 CPU 当 前 的 特权 模式 的 指令 。) 当 CPU 处 于 无 特权 模式 时 ， 任 何 执行 特 
权 指 令 的 企图 都 将 引起 中 断 。 这 个 中 断 将 CPU 转变 为 有 特权 模式 ， 并 将 控制 权 交 给 操作 系 
统 内 部 的 中 断 处 理 程序 。 

当 开 机 时 ，CPU 处 于 有 特权 模式 ， 因 此 操作 系统 在 引导 过 程 结束 后 开始 启动 时 ， 所 有 的 指 
令 都 可 以 执行 。 然 而 ， 每 当 操 作 系统 允许 一 个 进程 开始 一 个 时 间 片 时 ， 它 就 通过 执行 “改变 特 
权 模 式 ” 的 指令 ， 将 CPU 切换 到 无 特权 模式 。 于 是 ， 如 果 一 个 进程 试图 执行 有 特权 指令 ， 操 作 
系统 就 会 得 到 通知 ， 这 样 操作 系统 就 充当 了 维护 计算 机 系统 完整 性 的 角色 。 

有 特权 指令 和 特权 级 别 的 控制 是 操作 系统 维护 安全 性 可 用 的 一 个 主要 工具 。 然而 , 这 些 
工具 的 使 用 对 操作 系统 设计 而 言 是 一 项 复杂 的 任务 , 且 在 当前 的 操作 系统 中 , 错误 还 在 不 断 
出 现 。 因 此 , 在 特权 级 别 的 控制 中 ,任何 一 个 缺陷 都 可 能 给 灾难 打开 大 门 ， 不 论 是 恶意 程序 
员 引 起 的 , 还 是 无 意 中 的 程序 设计 错误 造成 的 。 如 果 人 允许 一 个 进程 更 改 控制 系统 多 道 程 序 设 
计 系 统 的 计时 器 ,那么 这 个 进程 就 能 够 延长 它 自己 的 时 间 片 ， 甚 至 控制 整个 机 器 。 如 果 人 允许 
一 个 进程 直接 访问 外 围 设备 , 那么 它 就 能 不 受 系统 文件 管理 程序 的 监管 而 读 取 文 件 。 如 果 允 
许 一 个 进程 访问 分 配给 它 的 区 域 之 外 的 存储 单元 , 那么 它 就 能 读 取 甚至 更 改 其 他 进程 正在 使 
用 的 数据 。 因 此 ， 维 护 计算 机 的 安全 性 ， 既 是 管理 员 的 一 个 重要 任务 ， 也 是 操作 系统 设计 的 
一 个 目标 。 


问题 与 练习 

1. 列举 几 个 口令 选取 不 好 的 例子 ， 并 说 明 为 什么 不 好 。 

2. 英特尔 奔腾 系列 处 理 器 提供 4 个 特权 级 别 。 为 什么 CPU 的 设计 人 员 选 择 提 供 4 个 特权 级 别 ， 而 不 是 3 个 
或 5 个 ? 

3. 如 果 多 道 程 序 设计 系统 里 的 一 个 进程 可 以 访问 分 配给 它 的 区 域 之 外 的 存储 单元 ,那么 它 怎样 获得 该 机 
器 的 控制 权 ? 
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( 带 * 的 题目 涉及 选读 音节 的 内 容 。) 


bt 


- 列 出 一 个 典型 操作 系统 的 4 个 活动 。 
Eh 
3. 


概述 批 处 理 和 交互 式 处 理 的 区 别 。 

假设 有 3 个 作业 R、S、T， 按 这 个 顺序 排 在 一 
个 作业 队列 里 。 接 着 ，1 个 作业 移出 队列 ， 第 4 
个 作业 X 进 入 队列 。 然 后 又 有 1 个 作业 移出 队 
列 ， 作 业 Y 和 作业 Z 进 入 队列 ， 最 后 ， 按 照 一 
次 一 个 作业 地 顺序 移出 , 使 队列 变 空 。 请 按 移 
出 的 顺序 列 出 所 有 的 作业 。 


4. 典 入 式 系统 和 PC 的 差别 是 什么 ? 


4 


. 什么 是 多 任务 处 理 操 作 系 统 ? 


6. 如 果 你 有 一 台 PC， 列 举 几 个 你 能 用 到 多 任务 


一 


处 理 功 能 的 情形 。 


. 根据 你 所 熟悉 的 计算 机 系统 , 列举 两 个 应 用 软 


件 单元 和 两 个 实用 软件 单元 , 然后 说 明 为 什么 
这 样 归 类 。 

a. 操作 系统 的 用 户 接 口 的 作用 是 什么 ? 

b. 操作 系统 的 内 核 的 作用 是 什么 ? 


. 路 径 X/Y/Z 描 述 的 是 什么 目录 结构 ? 

. 定义 操作 系统 环境 下 使 用 的 术语 “进程 ”。 

. 操作 系统 的 进程 表 里 包含 什么 信息 ? 

. 就 绪 进 程 和 等 待 进程 的 差别 是 什么 ? 

. 虚拟 内 存 和 主 存 储 器 之 间 的 差别 是 什么 ? 

. 假设 某 计算 机 有 512 MB (MiB) 的 主 存储 器 ， 


操作 系统 要 创建 主 存储 器 两 倍 大 小 的 页 式 虚 
拟 内 存 ， 页 面 大 小 为 2KB (KiB)， 请 问 需 要 
多 少 页 ? 


. 在 分 时 /多 任务 处 理 系统 里 ， 如 果 两 个 进程 同 


时 访问 同一 个 文件 ,会 发 生 怎样 混乱 的 情况 ? 
是 否 存 在 文件 管理 程序 应 批准 这 种 请 求 的 情 
形 ? 是 否 存在 文件 管理 程序 应 拒绝 这 种 请 求 
的 情形 ? 


. 应 用 软件 和 系统 软件 之 间 的 区 别 是 什么 ? 请 


各 举 一 个 例子 。 


. 定义 多 处 理 器 体系 结构 情况 下 的 负载 平衡 与 


均 分 。 


. 概述 引导 过 程 。 
. 为 什么 说 引导 过 程 是 必要 的 ? 
. 如 果 你 有 一 台 PC， 记 录 开 机 时 你 所 观察 到 的 


一 连 串 活动 。 然 后 确定 在 引导 进程 实际 开始 工 
作 之 前 有 哪些 信息 显示 在 计算 机 屏幕 上 ? 什 
么 软件 写 下 的 这 些 信息 ? 


. 假定 多 道 程序 设计 操作 系统 分 配 的 时 间 片 是 
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10 ms， 机 器 每 纳 秒 平均 执行 5 条 指令 , 那么 在 
一 个 时 间 片 内 能 执行 多 少 条 指令 ? 

如 果 一 个 打字 员 每 分 钟 能 打 60 个 单词 (在 这 里 
假设 一 个 单词 含 5 个 字符 ), 问 每 打 一 个 字符 要 
多 久 ? 如 果 多 道 程序 设计 操作 系统 分 配 的 时 
间 片 为 10 ms， 我 们 忽略 进程 间 切 换 的 时 间 ， 
问 打 一 个 字符 要 分 配 多 少时 间 片 ? 

假定 一 个 多 道 程 序 设计 操作 系统 分 配 的 时 
间 片 为 50 ms。 如 果 把 磁盘 的 读 写 磁头 定 位 到 
所 希望 的 磁道 上 通常 要 花费 8 ms, 并 且 磁 道上 
所 要 的 数据 旋转 到 读 写 磁头 之 下 通常 要 17 
ms， 那 么 等 待 一 个 读 磁盘 操作 发 生 可 能 要 多 
少 个 时 间 片 ? 如 果 该 机 器 每 纳 秒 能 执行 10 条 
指令 , 那么 在 这 个 等 待 时 间 里 可 以 执行 多 少 条 
指令 ?( 这 就 是 为 什么 当 第 一 个 进程 用 外 围 设 
备 完 成 操作 时 , 多 道 程序 设计 系统 终止 这 个 进 
程 的 时 间 片 , 让 另 一 个 进程 运行 而 让 第 一 个 进 
程 等 待 外 围 设 备 的 服务 。) 

列举 一 个 多 任务 处 理 操作 系统 必须 协调 访问 
的 5 种 资源 。 


. 如 果 一 个 进程 需要 执行 大 量 的 IO 操作 ， 我 们 


就 说 这 个 进程 是 IO 密集 型 的 ， 而 如 果 一 个 进 
程 由 大 多 数 在 CPU/ 存 储 系统 中 完成 的 计算 构 
成 , 我 们 就 说 这 个 进程 是 计算 密集 型 的 。 如 果 
这 两 种 进程 都 在 等 待 分 配 时 间 片 ,请问 如 何 确 
定 它们 的 优先 级 ? 为 什么 ? 


. 在 多 道 程 序 设计 环境 里 运行 两 个 进程 ， 如 果 


它们 两 个 都 是 IO 密集 型 的 ， 或 者 一 个 是 IO 
密集 型 的 ， 另 一 个 是 计算 密集 型 的 (如 上 题 
所 述 ), 那么 它们 是 否 能 达到 较 大 吞吐 量 ? 为 
什么 ? 

编写 一 组 指令 告诉 操作 系统 的 分 派 程 序 , 在 一 
个 进程 的 时 间 片 用 完 时 该 做 什么 ? 

一 个 进程 的 状态 中 包含 哪些 信息 ? 

列 出 多 道 程序 设计 系统 中 一 个 进程 不 会 全 部 
用 完 分 配给 它 的 时 间 片 的 情况 。 

按照 时 间 顺 序列 出 一 个 进程 被 中 断 时 发 生 的 
主要 事件 。 


. 按照 你 所 使 用 的 操作 系统 回答 下 列 问题 。 


a. 如 何 让 操作 系统 把 一 个 文件 从 一 个 地 方 复 
制 到 另 一 个 地 方 ? 

b. 如 何 让 操作 系统 显示 磁盘 上 的 目录 ? 

c， 如 何 让 操作 系统 执行 一 个 程序 ? 


32. 按照 你 所 使 用 的 操作 系统 回答 下 列 问题 。 


a. 操作 系统 如 何 限 制 仅 允许 已 批准 用 户 访问 
资源 ? 

b. 如 何 让 操作 系统 显示 当前 在 进程 表 里 的 
进程 ? 

c 如 何 告 诉 操作 系统 你 不 想 该 机 器 的 其 他 用 
户 访问 你 的 文件 ? 


*33. 解释 许多 机 器 语言 里 “测试 并 置 位 ” 指令 的 重 
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要 用 法 ,为 什么 整个 测试 并 置 位 过 程 作为 单个 
指令 实现 很 重要 ? 

一 个 银行 家 只 有 100 000 美 元 ， 贷 款 给 两 个 客 
户 ， 每 位 50 000 美 元 。 后 来 这 两 位 客户 回 了 同 
样 的 话 : 他 们 在 能 够 还 贷 之 前 各 自 还 需 10 000 
美元 来 完成 与 先前 贷款 有 关 的 商业 交易 。 这 个 
银行 家 通过 从 其 他 地 方 借 来 资金 (提高 贷款 利 
率 ) 贷 款 给 这 两 个 客户 ,解决 了 这 个 死 锁 问题 。 
在 死 锁 的 3 个 条 件 中 ， 银 行家 消除 了 其 中 的 哪 
个 条 件 ? 


. 每 个 想 参加 本 地 大 学 的 铁路 修建 模型 开课 程 


的 学 生 , 都 要 得 到 教师 的 允许 ,并且 交 纳 实验 
费 。 这 两 个 要 求 可 以 在 校园 的 不 同 地 点 办 理 ， 
可 以 按照 任意 顺序 独立 完成 。 注 册 学 生 限制 为 
20 名 ; 这 个 限制 由 教师 和 财务 处 一 起 掌握 , 前 
者 只 授权 20 名 学 生 ， 后 者 只 收 20 名 学 生 的 费 
用 。 假 定 这 个 注册 系统 有 19 名 学 生成 功 注 册 了 
这 一 课程 ， 但 是 最 后 这 个 名 额 有 两 名 学 生 竞 
争 一 一 一 名 仅 得 到 了 老师 的 允许 , 另 一 名 仅 交 
纳 了 费用 。 
下 面 解 决 该 问题 的 各 个 方案 中 , 分 别 消除 了 死 
锁 的 3 个 条 件 中 的 哪个 ? 
a. 同意 这 两 名 学 生 都 参加 该 课程 。 
b. 该 班 人 数 降 为 19 人 ， 因 此 这 两 名 学 生 都 不 
能 注册 该 课程 。 
c. 拒绝 这 两 名 竞争 的 学 生 ， 让 第 三 名 学 生成 
为 第 20 名 。 
. 注册 该 课程 的 要 求 改 为 一 个 :交纳 费用 。 于 
是 交 了 费用 的 学 生 注册 成 功 , 另 一 名 被 拒绝 。 
由 于 计算 机 显示 器 上 的 每 块 区 域 一 次 只 能 被 
一 个 进程 使 用 《否则 屏幕 上 的 图 像 将 难以 认 
清 )， 这 些 由 窗口 管理 程序 分 配 的 区 域 是 不 可 
共享 的 资源 。 为 了 避免 死 锁 ， 窗 口 管理 程序 应 
消除 死 锁 的 3 个 必要 条 件 中 的 哪 一 个 ? 
假设 一 个 计算 机 系统 里 的 不 可 共享 资源 分 为 3 
类 : 1 级 资源 ，2 级 资源 ，3 级 资源 。 其 次 ， 假 
设 系 统 中 的 每 一 个 进程 都 要 根据 这 个 类 别 请 


[= 


Wg 


3 


*4 


*4 


*4 


8. 


No 


0. 


ay 


khD 


复习 题 109 
求 它 所 需要 的 资源 。 也 就 是 说 ， 它 请 求 2 级 资 
源 之 前 必须 一 次 请 求 所 有 必要 的 1 级 资源 。 一 
旦 它 得 到 了 1 级 资源 , 就 可 以 申请 所 有 必要 的 2 
级 资源 ， 依 次 类 推 。 这 个 系统 会 出 现 死 锁 吗 ? 
为 什么 ? 

机 器 人 的 两 个 手臂 是 程序 控制 的 , 它们 从 传送 
带 上 取 零 件 , 测试 它们 的 公差 并 根据 结果 分 别 
把 它们 放 到 两 个 箱子 中 。 零 件 一 次 到 达 一 个 ， 
它们 之 间 有 足够 的 距离 为 了 防止 两 个 手臂 尝 
试 抓 同 一 个 零件 , 控制 手臂 的 计算 机 共享 一 个 
公共 的 存储 单元 ,如果 一 个 手臂 在 一 个 零件 到 
来 时 是 可 用 的 , 那么 控制 它 的 计算 机 就 读 公共 
单元 的 值 。 如 果 该 值 非 0， 那 么 这 一 手臂 让 那 
个 零件 通过 ; 否则 , 起 控制 作用 的 计算 机 把 一 
个 非 0 的 值 放 到 这 个 存储 单元 ， 指 挥 这 个 手臂 
抓 起 该 零件 ， 动 作 完成 后 再 把 值 0 存 入 该 存储 
单元 。 什 么 样 的 事件 序列 可 能 导致 两 个 手臂 之 
间 激 烈 竞 争 ? 


. 说 明 队列 在 假 脱 机 输出 到 打印 机 的 过 程 中 的 


使 用 。 

如 果 一 个 等 待 时 间 片 的 进程 一 直 都 没有 获得 
时 间 片 ， 我 们 就 说 这 个 进程 在 遭受 饥饿 
(starvation ) 。 

. 对 于 竞争 通过 交叉 口 的 汽车 来 说 ， 交 叉 口 
的 地 面 是 不 可 共享 的 资源 。 控 制 这 个 资源 
分 配 的 是 交通 灯 ， 而 不 是 操作 系统 。 如 果 
这 个 灯 能 够 感知 来 自 每 个 方向 的 交通 流 
量 ， 并 通过 程序 给 较 大 流量 的 方向 以 绿灯 ， 
流量 少 的 方向 就 可 能 遭受 饥饿 。 请 问 怎么 
避免 “饥饿 ”? 

在 一 个 进程 优先 级 保持 固定 的 优先 级 系统 
中 ， 如 果 调 度 程 序 总 是 按 优先 级 分 配 时 间 
片 ， 那 么 在 什么 时 候 一 个 进程 会 感到 “ 饥 
饿 ”? (提示 : 相对 于 正在 等 待 的 进程 来 
说 ， 刚 执行 完 时 间 片 的 进程 的 优先 级 是 什 
么 ， 并 且 接 下 来 按 哪 种 规则 分 配 下 一 个 时 
间 片 ? ) 你 能 猜 到 许多 操作 系统 是 怎么 避 
免 这 个 问题 的 吗 ? 


E> 


S 


. 死 锁 和 饥饿 《参见 问题 40) 的 相似 之 处 是 什 


么 ? 差别 又 是 什么 ? 


. 下 面 是 “哲学 家 进餐 ”问题 ， 它 最 初 是 由 E. W. 


Dijkstra 提 出 的 ， 现 在 已 经 是 计算 机 科学 传说 
中 的 一 部 分 。5 个 哲学 家 围 着 一 个 圆桌 就 座 ， 
每 个 人 面前 放 了 一 盘 意 大 利 面条 。 桌 上 有 5 把 
叉子 , 每 个 盘 之 间 有 一 把 , 每 个 哲学 家 都 在 思 
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考 和 吃 面 之 间 轮 换 。 为 了 吃 面 , 一 个 哲学 家 需 
要 拥有 紧 挨 他 盘子 的 2 把 叉子。 说明“ 哲学 家 
进餐 ”问题 中 的 死 锁 和 饥饿 ( 见 问 题 40) 问题 。 
对 于 一 个 多 道 程序 设计 系统 中 的 时 间 片 , 如 果 
使 其 越 来 越 短 , 那么 会 发 生 什么 情况 ? 越 来 越 


48. 


符 ) 的 字符 组 成 。 如 果 测 试 每 个 可 能 的 口令 
需要 1 ms， 那 么 测试 所 有 可 能 的 口令 需要 多 
长 时 间 ? 

为 什么 为 多 任务 处 理 操作 系统 设计 的 各 个 
CPU 能 够 在 不 同 特权 级 别 运 行 ? 


长 呢 ? 49. 
随 着 计算 机 科学 的 发 展 , 机 器 语言 已 被 扩展 以 50. 
提供 专门 指令 。 在 3.4 节 中 介绍 了 这 样 3 条 在 操 

作 系 统 中 广泛 使 用 的 指令 。 这 些 指令 是 什么 ? 5 


列举 两 个 由 有 特权 的 指令 请 求 的 典型 活动 ? 
列举 一 个 进程 可 能 挑战 计算 机 系统 (如 果 未 被 
操作 系统 防止 这 样 做 ) 安全 性 的 3 种 方式 。 

. 什么 是 多 核 操 作 系统 ? 


#44. 


Py 


45. 列举 操作 系统 管理 员 能 进行 而 一 般 用 户 不 能 52. 固件 更 新 和 操作 系统 更 新 之 间 的 区 别 是 什么 ? 
进行 的 两 个 活动 。 53. 窗口 管理 程序 与 操作 系统 有 什么 关系 ? 
46. 操作 系统 如 何 防止 一 个 进程 访问 男 一 个 进程 54. 因特网 浏览 器 〈Internet Explorer ) 是 微软 的 


的 存储 空间 ? 
47. 假定 一 个 口令 由 9 个 取 自 英文 字母 表 (26 个 字 5 


Windows 操 作 系统 的 一 部 分 吗 ? 
嵌入 式 操 作 系统 能 够 解决 哪些 特殊 问题 ? 


bd 


一 一 一 一 一 


社会 问题 


希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 道德 、 社 会 和 法 律 问 题 。 回 答 出 这 

些 问 题 还 不 够 ， 还 应 该 考虑 为 什么 这 样 回 答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

1. 假定 你 在 使 用 一 个 多 用 户 操作 系统 ， 它 允许 你 查看 其 他 用 户 的 文件 的 名 字 ， 而 且 如 果 那 
些 文件 没有 加 保护 措施 ， 它 还 允许 查看 那些 文件 的 内 容 。 未 经 允许 就 查看 这 些 信息 是 类 
似 于 未 经 允许 就 闲逛 别人 未 锁 门 的 房间 ， 还 是 类 似 于 阅读 放 在 公共 休息 室 〈 如 医生 的 候 
诊室 ) 的 资料 ? 

. 若 访问 一 个 多 用 户 计 算 机 系统 ， 你 在 选择 口令 时 有 什么 责任 ? 

. 如 果 一 个 操作 系统 有 安全 性 缺陷 ， 使 得 一 个 恶意 的 程序 员 能 够 在 未 经 批准 的 情况 下 访问 
其 敏感 数据 ， 那 么 该 操作 系统 的 开发 人 员 应 该 负 多 大 的 责任 ? 

. 你 有 责任 锁 好 门 防 止 入 侵 者 入 内 ， 还 是 公众 有 责任 在 未 受 邀 请 时 待 在 屋外 ? 操作 系统 有 
责任 防备 别人 对 计算 机 及 其 内 容 的 访问 ， 还 是 黑客 有 责任 不 入 侵 机 器 ? 

. 在 《瓦尔 登 湖 》 一 书 中 ， 享 利 。 戴 维 。 梭 罗 坚 持 认 为 ， 我 们 已 经 变 成 自己 工具 的 工 
有 具 ; 也 就 是 说 , 我 们 并 非 从 所 拥有 的 工具 中 受益 ,而 是 要 花费 时 间 得 到 和 维护 工具 。 
对 于 计算 机 ， 这 在 多 大 程度 上 是 真 的 ? 如 果 你 有 一 台 PC， 那 么 你 要 花 多 少时 间 去 赚 
钱 承担 它 的 费用 、 学 习 如 何 使 用 它 的 操作 系统 、 学 习 如 何 使 用 它 的 实用 软件 和 应 用 
软件 、 维 护 它 ， 以 及 为 它 的 软件 下 载 更 新 包 ? 你 得 到 的 好 处 的 时 间 量 与 你 花费 的 时 
间 总 量 相 比 又 如 何 ?” 使 用 它 时 , 你 花费 的 时 间 值 得 吗 ? 有 没有 PC 对 你 的 人 际 交往 活 
跃 度 有 影响 吗 ? 
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组 网 及 因特网 


章 讨论 计算 机 科学 中 被 称 为 组 网 的 领域 , 包括 学 习 如 何 将 计算 机 连接 起 来 共享 信息 
和 资源 。 学 习 的 内 容 包括 网 络 的 结构 与 操作 、 网 络 的 应 用 以 及 网 络 安全 问题 。 学 习 





的 一 个 重点 主题 是 遍布 世界 范围 的 特殊 网 络 一 一 因特网 。 
本 章 内 容 
4.1 网 络 基础 *4.4 因特网 协议 
4.2 因特网 4.5 安全 性 
4.3 万 维 网 


人 们 对 不 同 计算 机 之 间 共 享 信息 和 资源 的 需求 催生 了 相互 连接 的 计算 机 系统 ， 它 被 称 为 网 
络 Cnetwork)。 计 算 机 通过 网 络 连接 在 一 起 ， 数 据 可 以 从 一 台 计 算 机 传送 到 另 一 台 计 算 机 。 在 
网 络 中 ， 计 算 机 用 户 可 以 相互 交换 信息 ， 并 且 可 以 共享 分 布 在 整个 网 络 系统 中 的 资源 ， 如 打印 
功能 、 软 件 包 以 及 数据 存储 设施 。 用 于 支持 这 类 应 用 的 基础 软件 也 已 经 从 简单 的 实用 软件 包 升 
级 为 扩展 网 络 软件 系统 ， 从 而 可 以 提供 一 个 复杂 的 网 络 范围 的 基础 架构 。 从 某 种 意义 上 说 ， 网 
络 软件 正 发 展 为 网 络 范围 的 操作 系统 。 本 章 将 探讨 计算 机 科学 中 这 个 不 断 发 展 的 领域 。 


4.1 ”网络 基础 
我 们 从 多 种 基本 的 组 网 概念 开始 学 习 网 络 。 


4.1.1 网 络 分 类 


计算 机 网 络 通常 分 为 个 人 域 网 (personal area network，PAN)、 局 域 网 (local area network， 
LAN)、 城 域 网 ‘metropolitan area network，MAN ) 和 广域网 (wide area network，WAN)。 个 人 
域 网 通常 用 于 小 范围 的 通信 ， 一 般 范 围 只 有 几米 ， 如 无 线 耳 机 与 智能 手机 之 间 的 通信 ， 或 者 
无 线 鼠 标 与 PC 之 间 的 通信 。 相 比 之 下 ， 局 域 网 通常 由 一 个 建筑 物 或 者 一 个 建筑 群 中 的 若干 计 
算 机 组 成 。 例 如 ， 大 学 校园 的 计算 机 或 者 制造 三 中 的 计算 机 都 可 以 用 局 域 网 连接 。 城 域 网 属 
于 中 型 网 络 ， 如 横 跨 一 个 社区 的 城 域 网 。 而 广域网 能 连接 距离 更 远 的 机 器 ， 如 周边 城市 或 世界 
的 两 端 。 

网 络 的 另 一 种 分 类 依据 是 , 网 络 的 内 部 操作 是 基于 公共 领域 的 设计 , 还 是 基于 特定 实体 (如 
个 人 或 公司 ) 所 拥有 并 控制 的 创新 。 前 一 种 类 型 的 网 络 称 为 开放 式 (open) 网 络 ， 后 一 种 称 为 
封闭 式 (closed) 网 络 ， 有 时 也 称 为 专用 (proprietary) 网 络 。 开 放 式 网 络 允 许 自 由 流通 ， 因 此 
更 容易 被 大 众 所 接 受 ， 这 就 是 它们 通常 最 终 战 胜 专 有 网 络 的 原因 ， 因 为 专 有 网 络 的 应 用 受到 许 
可 费 和 合约 条 件 的 限制 。 
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因特网 〈 马 上 要 讲 到 的 一 种 全 球 流行 的 网 络 的 网 络 》 属 于 开放 式 系统 。 尤 其 是 ， 贯 穿 因 特 
网 的 通信 和 是 由 一 组 称 为 TCP/IP 协 议 簇 的 开放 标准 (这 是 4.4 节 的 主题 ) 控制 的 。 任 何人 都 可 以 目 
由 地 使 用 这 些 标准 ， 而 不 需要 付费 或 是 签署 许可 协议 。 相 反 ， 像 Novell 公 司 这 样 的 公司 可 能 会 
开发 一 些 专 用 系统 并 选择 保持 其 所 有 权 ， 人 允许 公司 通过 出 售 或 出 租 它们 获 利 。 

还 有 一 种 网 络 分 类 方法 依据 的 是 网 络 的 拓扑 ， 即 机 器 连接 的 模式 。 两 种 比较 流行 的 拓扑 是 ; 
总 线 型 ， 即 所 有 机 器 都 通过 同一 条 被 称 为 “总 线 ” 的 通信 线路 连接 起 来 〈 见 图 4-1a); 星 型 ， 即 
将 一 台 机 器 作为 中 心 焦点 ， 所 有 其 他 机 器 都 与 之 相连 ( 见 图 4-1b)。20 世 纪 90 年 代 ， 总 线 型 拓扑 
得 以 流行 ， 当 时 是 通过 称 为 以 太 网 的 一 组 标准 实现 的 ， 而 且 以 太 网 依然 是 目前 使 用 的 最 流行 的 
组 网 系统 之 一 。 


计算 机 计算 机 计算 机 计算 机 
| 


计算 机 *、、 各 和 一 计算 机 


de Ss 
计算 机 ”计算 机 计算 机 计算 机 


(a) 总 线 型 (b) 星 型 
图 4-1 ”两 种 流行 的 网 络 拓 扑 


星 型 拓扑 可 以 追溯 到 20 世 纪 70 年 代 ， 它 由 一 台大 型 中 央 计 算 机 服务 于 多 个 用 户 的 范例 发 展 
而 来 。 随 着 用 户 使 用 的 简单 终端 发 展 成 为 小 型 计算 机 ， 星 型 拓扑 应 运 而 生 。 目 前 ， 星 型 配置 在 
无 线 网 络 中 比较 流行 ， 无 线 网 络 中 的 通信 和 是 通过 无 线 电 广播 和 中 央 机 器 实现 的 ， 这 里 的 中 央 机 
器 被 称 为 接 入 点 (access point，AP)， 是 协调 所 有 通信 的 焦点 。 

总 线 型 网 和 星 型 网 在 设备 的 物理 排列 上 的 区 别 并 非 总 是 很 明显 。 二 者 的 区 别 在 于 网 络 中 的 
机 器 是 通过 一 条 公共 总 线 直 接 通信 ， 还 是 通过 中 间 的 中 央 机 器 间接 通信 。 例 如 ， 总 线 型 网 可 能 
不 会 出 现 图 4-1 中 描述 的 那 种 各 个 计算 机 通过 一 条 短 链 路 连接 到 一 条 长 总 线 上 的 情况 。 相 反 ， 总 
线 型 网 的 总 线 可 能 很 得, 到 各 个 机 器 的 链 路 却 很 长 ,这 意味 着 总 线 型 网 看 起 来 会 比较 像 星 型 网 。 
确实 ， 有 时 总 线 型 网 会 通过 链 路 将 每 台 计 算 机 连接 到 中 央 位 置 ， 在 中 央 位 置 再 连接 到 一 种 叫 作 
集线器 (hub) 的 设备 上 。 集 线 器 其 实 就 是 一 条 非常 短 的 总 线 ， 其 功能 在 于 将 接收 到 的 任何 信和 号 
(可 能 会 经 过 一 些 放 大 ) 传 回 给 与 之 相连 的 所 有 机 器 。 尽 管 使 用 集线器 的 结果 看 起 来 像 星 型 网 ， 
但 在 运作 上 像 总 线 型 网 。 


4.1.2 协议 


为 了 网 络 运行 可 靠 ， 建 立 管理 网 络 活动 的 规则 很 重要 ， 这 类 规则 称 为 协议 〈protocol)。 通 
过 开发 及 采纳 协议 标准 ， 广 商 能 够 生产 出 与 其 他 厂商 的 网 络 应 用 产品 相 兼容 的 产品 。 因 此 ， 在 
网 络 技术 的 开发 中 ， 协 议 标准 的 开发 是 一 个 必 不 可 少 的 环节 。 

为 了 介绍 协议 概念 ， 我 们 考虑 这 样 一 个 问题 ， 如 何 协 调 网 络 中 计算 机 之 间 报 文 的 传输 。 如 
果 没 有 控制 此 类 通信 的 规则 ， 所 有 的 计算 机 就 很 可 能 同时 抢 着 传输 报 文 ， 或 者 在 其 他 机 器 需要 
协助 时 也 无 法 提供 帮助 。 

在 基于 以 太 网 标准 的 总 线 型 网 中 ， 报 文 传输 的 许可 是 通过 名 为 带 冲突 检测 的 载波 侦 听 多 址 
访问 (carrier sense，multiple access with collision detection，CSMA/CD) 的 协议 控制 的 。 该 协议 
规定 每 条 报 文 都 要 广播 给 总 线 上 的 所 有 机 器 〈 见 图 4-2)。 每 台 机 器 都 对 所 有 报 文 进行 监听 ， 但 
是 只 保存 发 送 给 自己 的 报 文 。 要 想 传 输 报 文 ， 机 器 需要 等 到 总 线 空 时 才能 开始 传输 并 继续 
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监听 总 线 。 如 果 男 一 台 机 器 也 开始 传输 报 文 ， 那么 两 台 机 器 都 会 检测 到 这 种 冲突 ， 并 各 自 暂 停 一 段 
随机 长 的 时 间 ， 然 后 再 次 尝试 传输 。 这样 的 结果 类 似 于 一 小 群 人 在 交谈 中 使 用 的 系统 ， 如果 两 个 人 
同时 开始 讲话 ， 他 们 两 个 都 会 停 下 来 。 不 同 的 是 ， 人 们 可 能 会 有 一 系列 对 话 ， 如 :“ 对 不 起 ， 刚 才 
你 想 说 什么 ?”“ 不 ， 不 ， 你 先 说 。” 但 是 在 CSMA/CD 协 议 下 ， 每 台 机 器 都 只 会 稍 后 再 作 尝 试 。 


计算 机 计算 机 计算 机 


二 一 一 一 一 


计算 机 计算 机 
图 4-2 ”通过 总 线 型 网 通信 


注意 ，CSMA/CD 和 无 线 星 型 网 并 不 兼容 。 在 无 线 星 型 网 中 ， 所 有 的 机 器 都 通过 中 央 接 入 点 
进行 通信 ， 因 为 一 台 机 器 可 能 无 法 检测 到 它 与 其 他 计算 机 的 传输 冲突 。 例 如 ， 一 台 机 器 可 能 监 
听 不 到 其 他 机 器 ， 因 为 自己 的 信号 淹没 了 其 他 机 器 的 信号 。 男 一 个 原因 可 能 是 不 同 机 器 的 信号 
由 于 障碍 物 或 者 距离 的 原因 互相 阻塞 了 ， 虽 然 它们 都 能 与 中 央 接 入 点 进行 通信 ， 这 种 情况 称 为 
隐藏 终端 问题 (hidden terminal problem ) 〈 见 图 4-3)。 这 样 的 结果 就 是 无 线 网 络 采 用 尝试 避免 冲 
突 的 策略 ， 而 不 是 尝试 检测 冲突 的 策略 。 这 种 策略 被 归 类 为 带 冲突 避免 的 载波 侦 听 多 址 访问 
(Carrier Sense, Multiple Access with Collision Avoidance，CSMA/CA)， 其 中 很 多 策略 是 由 IEEE 
( 见 第 7 章 中 提 及 的 “美国 电气 电子 工程 师 学 会 ?>) 在 IEEE 802.11 中 定义 的 协议 下 进行 标准 化 的 ， 
通常 被 称 为 无 线 保 真 (WiFi)。 需 要 强调 的 是 ， 冲 突 避 免 协 议 的 设计 目的 是 避免 冲突 ， 也 许 并 不 
能 完全 消除 冲突 。 当 冲突 发 生 时 ， 必 须 重新 传输 报 文 。 


“B 涵 羔 的 范围 





ee 
B 国 ,~ 接 入 尺 
A 涵盖 的 范围 尽管 每 个 终端 系统 


都 可 以 与 接 入 点 进 
行 通信 ， 但 它们 都 
无 法 互相 监听 到 
图 4-3 ”隐藏 终端 问题 


最 常见 的 冲突 避免 方法 是 将 优先 权 赋 予 已 经 在 等 待 传输 机 会 的 计算 机 。 这 种 协议 和 以 太 网 
的 CSMA/CD 有 相似 之 处 。 二 者 的 主要 区 别 在 于 ， 当 一 台 机 器 首先 需要 传输 报 文 , 并 且 发 现 通 信 
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言 道 处 于 空闲 时 ， 它 并 不 是 立即 开始 传输 。 相 反 ， 它 会 等 一 小 段 时 间 ， 只 有 当 信道 在 这 一 段 时 
间 内 都 保持 空闲 时 才 会 开始 传输 。 如 果 在 这 个 过 程 中 ， 发 现 这 是 一 个 忙 信 道 ， 那 么 机 器 会 等 待 
一 段 随机 决定 的 时 间 ， 然 后 再 重新 和 尝试。 一 旦 这 段 时 间 耗 尽 ， 这 人 台 机 器 就 被 允许 立即 要 求 占 用 
空闲 信道 。 这 就 意味 着 避免 了 “新 来 者 ”和 已 经 处 于 等 待 状态 的 机 器 之 间 的 冲突 ， 因 为 “新 来 
者 ”需要 等 到 一 直 处 于 等 待 状态 的 所 有 机 器 都 开始 传输 之 后 ， 才 会 被 允许 要 求 占用 空闲 信道 。 

然而 ， 该 协议 无 法 解决 隐藏 终端 问题 。 毕 竟 ， 任 何 基 于 辨别 闲 信道 或 者 忙 信道 的 协议 都 需 
要 每 个 站 点 都 能 够 监听 到 其 他 所 有 站 点 。 为 了 解决 这 一 问题 ， 一 些 WiFi 网 络 要 求 每 台 计 算 机 向 
接 入 点 发 送 简短 的 “请 求 ” 报 文 ， 并 等 待 接 入 点 确认 收 到 请 求 ， 然 后 再 传输 完整 的 报 文 。 如 果 
接 入 点 由 于 正在 处 理 “ 隐 藏 终端 ”处 于 繁忙 状态 ， 将 会 忽略 请 求 ， 然 后 请 求 的 机 器 将 获悉 并 等 
待 。 否 则 ， 接 入 点 会 确认 请 求 ， 机 器 将 获悉 现在 进行 传输 是 安全 的 。 注 意 ， 尽 管 机 器 无 法 监听 
到 正在 发 生 的 报 文 传输 ， 但 是 网 络 中 所 有 的 机 器 都 能 监听 到 接 入 点 发 出 的 所 有 确认 ， 因 此 就 能 
知道 接 入 点 在 任何 给 定时 间 是 否 繁忙 。 


4.1.3 组 合 网络 


有 时 候 需 要 连接 现 有 网 络 以 形成 一 个 扩展 的 通信 系统 ， 这 可 以 通过 将 网 络 连接 成 一 个 相同 
“类 型 ” 的 更 大 的 网 络 来 实现 。 例 如 ， 对 于 基于 以 太 网 协议 的 总 线 型 网 ， 经 常 可 以 将 总 线 连接 起 
来 形成 一 根 长 总 线 。 这 可 以 通过 中 继 器 、 网 桥 、 交 换 机 等 不 同 的 设备 来 完成 ， 这 些 设 备 的 区 别 
微妙 且 信 息 量 大 。 它 们 中 最 简单 的 是 中 继 器 〈repeater)， 它 仅仅 是 在 两 个 原始 总 线 间 简单 地 来 
回 传 送信 号 (通常 有 某 种 形式 的 放大 〉 的 设备 ， 而 不 会 考虑 信号 的 含义 ( 见 图 4-4a)。 

网 桥 (bridge) 类 似 于 中 继 器 , 但 是 比 中 继 器 更 复杂 。 与 中 继 器 相似 , 它 也 是 连接 两 条 总 线 ， 
但 是 不 必 在 连接 上 传输 所 有 的 报 文 。 相 反 ， 网 桥 要 检查 每 条 报 文 的 目的 地 址 ， 当 报 文 的 目的 地 
是 另 一 边 的 计算 机 时 才 在 连接 上 转发 这 个 报 文 。 因 此 ， 在 网 桥 同一 侧 的 两 台 机 器 不 需要 干扰 另 
一 边 的 通信 就 可 以 互相 传输 报 文 。 相 对 于 中 继 器 ， 网 桥 形 成 的 系统 更 加 高 效 。 

交换 机 〈switch) 本 质 上 就 是 具有 多 连接 的 网 桥 ， 可 以 连接 若干 条 总 线 ， 不 止 两 条 。 因 此 ， 
交换 机 形成 的 网 络 包括 若干 从 交换 机 延伸 出 来 的 总 线 ， 它 们 就 类 似 于 车 轮 的 辐 条 ( 见 图 4-4b)。 与 
网 桥 一 样 ， 交 换 机 也 要 考虑 所 有 报 文 的 目的 地 址 ， 并 且 仅 仅 转发 那些 目的 地 是 其 他 “ 辐 条 ”的 
报 文 。 此 外 , 被 转发 的 每 一 个 报 文 只 会 被 转送 至 相应 的 “ 辐 条 ” 因此 最 大 限度 地 减轻 了 每 根 “ 辐 
条 ”的 传输 流量 。 





中 继 器 交换 机 
或 网 桥 
(a) 连接 两 根 总 线 的 中 继 器 或 网 桥 (b) 连接 多 根 总 线 的 交换 机 


图 4-4 ”将 规模 较 小 的 总 线 型 网 组 建成 大 型 总 线 型 网 
需要 重点 注意 的 是 ， 当 计算 机 通过 中 继 器 、 网 桥 以 及 交换 机 连接 时 得 到 的 是 一 个 大 型 网 络 。 
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整个 系统 《使 用 相同 的 协议 ) 以 相同 的 方式 运作 ， 就 像 每 个 规模 较 小 的 原始 网 络 一 样 。 

然而 ， 要 连接 的 网 络 有 时 候 会 有 不 兼容 的 特性 。 例 如 ，WiFi 网 络 的 特性 就 可 能 与 以 太 网 网 
络 中 的 不 兼容 。 在 这 种 情况 下 ， 网 络 必 须 按 建立 一 个 网 络 的 网 络 [ 称 为 互联 网 (Cinternet)] 的 方 
式 连 接 。 在 这 个 网 络 中 ， 原 始 网 络 仍然 保持 其 独立 性 ， 并 且 继 续 作 为 独立 的 网 络 运行 。 注 意 ， 
通用 术语 互联 网 (internet) 不 同 于 因特网 〈Internet)。 后 者 的 首 字母 是 大 写 的 I， 指 的 是 一 种 独 
特 的 、 世 界 范 围 的 互联 网 ， 本 章 后 面 会 介绍 。 现 实 中 有 许多 互联 网 的 例子 。 事 实 上 ， 在 因特网 
流行 之 前 ， 传 统 的 电话 通信 就 是 由 世界 范围 的 互联 网 系统 操控 的 。 

把 网 络 连 接 起 来 形成 互联 网 的 设备 是 路 由 器 (router)， 这 是 一 种 用 来 传送 报 文 的 专用 计算 
机 。 注 意 ， 路 由 器 的 任务 与 中 继 器 、 网 桥 和 交换 机 的 不 同 ， 路 由 器 提供 的 是 网 络 之 间 的 链接 ， 
并 允许 每 个 网 络 保持 它 独特 的 内 部 特性 。 作 为 一 个 例子 ， 图 4-5 描 述 了 通过 路 由 器 组 连接 两 个 
WiFi 星 型 网 和 一 个 以 太 总 线 型 网 的 情形 。 当 某 个 WiFi 网 络 中 的 一 台 机 器 想 要 给 以 太 网 中 的 一 台 
机 器 发 送 报 文 时 ， 它 首先 会 把 报 文 发 送 到 其 网 络 中 的 接 入 点 ， 接 入 点 再 把 报 文 发 送 到 与 之 相连 
的 路 由 器 ， 该 路 由 器 把 报 文 转发 至 以 太 网 中 的 路 由 器 。 在 那里 该 报 文 被 发 送 给 总 线 上 的 一 台 机 
器 ， 然 后 这 人 台 机 器 把 报 文 转发 到 它 在 以 太 网 中 的 最 终 目的 地 。 


2 RS WiFi 网 络 


入 


路 由 器 路 由 器 
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入 WiFi 网 络 


图 4-5 路 由 器 将 两 个 WiFi 网 络 和 一 个 以 太 网 连接 成 了 一 个 互联 网 


路 由 器 得 名 的 原因 在 于 它们 的 用 途 是 向 适当 的 方向 转发 报 文 。 转 发 过 程 是 基于 互联 网 范围 
的 寻 址 系统 进行 的 ， 这 个 系统 为 互联 网 上 的 所 有 设备 《包括 原始 网 络 中 的 机 器 和 路 由 器 ) 都 赋 
予 了 唯一 的 地 址 。( 这 样 ， 原 始 网 络 中 的 每 台 机 器 都 有 两 个 地 址 : 自己 网 络 内 的 “本 地 ”地 址 和 
它 的 互联 网 地 址 。) 一 台 机 器 想 给 远程 网 络 中 的 另 一 台 机 器 发 送 报 文 ， 需 要 先 将 报 文 的 目的 地 互 
联网 地 址 附 在 报 文 上 ,然后 再 把 报 文 发 送 给 其 本 地 的 路 由 器 , 在 那里 报 文 将 向 适当 的 方向 转发 。 
为 了 转发 报 文 ， 每 个 路 由 器 都 维护 了 一 张 转发 表 (forwarding table)， 表 中 包含 的 信息 能 让 路 由 
器 依据 每 条 信息 的 目的 地 址 来 确定 其 应 该 被 发 送 到 哪个 方向 。 

一 个 网 络 与 互联 网 链接 的 “点 ”通常 称 为 网 关 〈gateway )， 因 为 它 是 网 络 与 外 部 世界 之 间 
的 通道 。 网 关 有 多 种 形式 ， 因 而 这 个 术语 的 使 用 不 太 严 谨 。 在 许多 情况 下， 网 络 的 网 关 仅仅 是 
路 由 器 ， 通 过 它 ， 网 络 能 与 互联 网 上 的 其 他 网 络 通信 。 在 其 他 情况 下 ， 术 语 网 关 所 指 的 可 能 不 
仅仅 是 一 合 路由器。 例如 ， 在 连接 到 因特网 的 多 数 住宅 WiFi 网 络 中 ， 术 语 网 关 指 的 是 网 络 的 接 
入 点 和 与 接 入 点 相连 的 路 由 器 ， 因 为 这 两 个 设备 通常 安装 在 一 个 单元 中 。 
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4.1.4 进程 间 通 信 的 方法 


一 个 网 络 中 ,在 不 同 计算 机 上 执行 〈 甚 至 在 一 台 计 算 机 上 通过 分 时 /多 任务 处 理 执行 ) 的 各 
种 活动 〈 或 进程 ) 必须 经 常 互相 通信 ， 以 便 协 调 行动 并 完成 指派 的 任务 ， 这 种 进程 之 间 的 通信 
称 为 进程 间 通 信 (interprocess communication ) 。 

进程 间 通 信 通 常 采用 的 是 客户 机 /服务 器 〈client/server) 模型 。 这 种 模型 规定 了 进程 的 基本 
角色 , 或 者 是 向 其 他 进程 发 出 请 求 的 客户 机 (client), 或 者 是 满足 客户 机 请 求 的 服务 器 (server)。 

客户 机 /服务 器 模型 的 一 种 早期 应 用 出 现在 连接 办 公 室 间 的 所 有 计算 机 的 网 络 中 。 在 这 种 应 
用 中 ， 只 要 把 一 台 高 质量 的 打印 机 连接 到 网 络 上 ， 网 络 中 的 所 有 机 器 就 都 能 使 用 它 。 在 这 种 情 
况 下 ， 打 印 机 的 角色 就 是 服务 器 ， 常 称 为 打印 服务 器 (print server)， 其 他 机 器 为 客户 机 ， 传 递 
打印 请 求 给 打印 服务 器 。 

客户 机 /服务 器 模型 的 另外 一 种 早期 应 用 是 用 于 减少 磁盘 存储 成 本 ， 同 时 消除 复制 记录 副本 
的 需要 。 在 这 种 情况 下 ， 网 络 中 的 某 一 台 机 器 需要 配备 高 容量 海量 存储 系统 〈 通 党 是 磁盘 )， 存 
储 某 一 组 织 的 所 有 记录 ;网络 中 的 其 他 机 器 在 需要 记录 时 ， 可 以 请 求 访问 记录 。 于 是 ， 实 际 包 
含 记录 的 机 器 扮演 的 就 是 服务 器 的 角色 ， 称 为 文件 服务 器 (file server)， 而 那些 请 求 访 问 存储 在 
文件 服务 器 中 的 文件 的 其 他 机 器 扮演 的 就 是 客户 机 的 角色 。 

客户 机 /服务 器 模型 在 当今 的 网 络 应 用 中 使 用 广泛 ， 这 一 点 在 本 章 后 面 能 看 到 。 不 过 ， 客 户 
机 /服务 器 模型 不 是 进程 间 通信 的 唯一 方式 , 另外 一 种 模型 是 对 等 (peer-to-peer, 通常 简称 为 P2P) 
模型 。 客 户 机 /服务 器 模型 是 一 个 进程 《服务 器 ) 为 许多 其 他 进程 〈 客 户 机 ) 提供 服务 ， 而 对 等 
模型 中 的 进程 既 为 对 方 提供 服务 ， 也 接收 对 方 的 服务 〈 见 图 4-6)。 此 外 ， 为 了 随时 服务 于 客户 
机 ， 服 务 器 必须 持续 运作 ， 但 是 对 等 模型 中 的 进程 通 


常 都 是 临时 执行 的 。 例 如 ， 对 等 模型 的 应 用 包括 即时 ”| 客户 机 | 要 机 ,| 
消息 处 理 ， 人 们 利用 即时 消息 处 理 通过 因特网 或 者 一 所 
些 竞技 性 交互 游戏 进行 文字 交流 。 上 


对 等 模型 也 是 通过 因特网 分 发 诸如 音乐 录音 和 运 
动 图 像 这 类 文件 的 常用 方法 。 在 这 种 情况 下 ， 一 个 对 
等 体 可 以 从 另 一 个 对 等 体 接收 文件 ， 然 后 把 此 文件 提 | 客户 机 | 客户 机 
供给 其 他 的 对 等 体 。 参 与 这 种 分 发 的 对 等 体 集合 有 时 “(a) 服务 器 必须 准备 随时 为 多 个 客户 机 服务 
称 为 蜂 群 (swarm)。 文 件 分 发 的 蜂 群 方法 与 先前 使 用 i 
客户 机 /服务 器 模型 的 方法 相反 ,该 模型 需要 建立 中 央 5 
分 发 中 心 (服务 器 ), 以 使 客户 端 从 该 中 心 下 载 文件 (或 。 (b) 两 个 对 等 体 在 一 对 一 的 基础 上 平等 地 通信 
至 少 是 找到 那些 文件 的 源 )。 ri 

从 文件 共享 的 角度 来 看 , P2P 模 型 正在 取代 客户 机 。 窑 / 册 服务 器 模型 对 革 模 于 的 比 匀 
/服务 器 模型 的 一 个 原因 在 于 ， 它 把 服务 任务 分 布 到 许多 的 对 等 体 上 ， 而 不 是 集中 在 一 个 服务 器 
上 。 这 种 非 集中 化 的 操作 构建 了 更 高 效 的 系统 。 遗 憾 的 是 ， 基 于 P2P 模 型 的 文件 分 发 系统 流行 
的 另 一 个 原因 在 于 ， 在 合法 性 遭 到 质疑 的 情况 下 ， 缺 乏 中 心服 务 器 使 得 版 权 执 法 行动 变 得 更 为 
困难 。 但 是 ， 也 存在 许多 案例 ， 其 中 ， 一 些 人 发 现 “ 困 难 ” 并 不 意味 着 “不 可 能 ”， 并 且 由 于 版 
权 侵 犯 的 问题 ， 他 们 发 现 自己 面临 着 重大 的 责任 。 

你 可 能 经 常 读 到 或 者 听 到 对 等 网 络 这 个 术语 ， 这 个 例子 正好 说 明了 非 科 技 界 采用 科技 术语 
时 是 如 何 产生 误 用 的 。 术 语 对 等 指 的 是 两 个 进程 通过 网 络 (或 者 互联 网 ) 通信 的 一 种 系统 ， 并 
不 是 网 络 (或 者 互联 网 ) 的 一 种 特性 。 一 个 进程 可 以 开始 采用 对 等 模型 与 另外 一 个 进程 通信 ， 
接着 又 采用 客户 机 /服务 器 模型 通过 同一 个 网 络 与 另外 一 个 进程 通信 。 因 此 ， 更 准确 地 说 ， 应 该 
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是 利用 对 等 模型 通信 ， 而 不 是 通过 对 等 网 络 通 信 。 
4.1.5 ”分 布 式 系统 


因为 组 网 技术 的 成 功 ， 计 算 机 之 间 通 过 网 络 的 交互 已 经 很 普遍 ， 并 且 涉 及 方方面面 。 许 多 
现代 软件 系统 ， 如 全 球 信息 检索 系统 、 公 司 范围 的 会 计 和 库存 系统 、 计 算 机 游戏 甚至 操控 网 络 
基础 设施 本 身 的 软件 ， 都 被 设计 成 分 布 式 系统 〈distributed system)。 这 意味 着 ， 它 们 由 在 网 络 
中 不 同 计 算 机 上 作为 进程 执行 的 软件 单元 组 成 。 

早期 的 分 布 式 系统 是 从 零 开 始 独立 开发 的 。 不 过 现在 ， 研 究 显 示 ， 公 共 的 基础 设施 正 运行 
在 包括 诸如 通信 系统 及 安全 系统 这 样 的 系统 上 。 于 是 ， 人 们 开始 努力 生产 能 够 提供 这 种 基础 设 
施 的 预制 系统 ， 因 此 要 构建 一 个 分 布 式 应 用 ， 只 需要 开发 系统 中 应 用 所 特有 的 部 分 即 可 。 

现在 , 一 些 类 型 的 分 布 式 计算 系统 很 常见 。 集 群 计算 (cluster computing) 指 的 是 一 种 分 布 式 系统 ， 
其 中 多 个 独立 的 计算 机 密切 合作 ， 提 供 的 计算 或 服务 可 与 大 得 多 的 机 器 相 比 拟 。 这 些 独立 的 机 器 ， 加 
上 连接 它们 的 高 速 网 络 的 总 成 本 ， 要 比 一 台 高 价位 的 超级 计算 机 的 成 本 低 ， 但 其 可 靠 性 更 高 ， 维 护 成 
本 更 低 。 这 样 的 分 布 式 系统 用 于 提供 高 可 用 性 high-availability， 因 为 这 更 有 可 能 保证 集群 中 至 少 有 
一 个 成 员 能 够 响应 请 求 ， 即 使 集群 中 其 他 成 员 发 生 故障 或 不 可 用 〉 和 负载 平衡 (load-balancing， 因 为 
负载 可 以 自动 从 集群 中 负载 太 大 的 成 员 转 移 到 负载 太 小 的 成 员 )。 网 格 计算 (grid computing) 是 指 硝 
合 度 没 有 集群 高 但 是 仍 能 共同 协作 完成 大 型 任务 的 分 布 式 系统 。 网 格 计算 可 能 需要 专门 的 软件 ， 以 便 
更 容易 地 分 发 数据 和 算法 到 网 格 中 的 机 器 。 威斯康星 大 学 的 Condor 系 统 和 伯克利 开放 式 网 络 计算 平台 
(Berkeley’s Open Infrastructure for Network Computing，BOINC ) 都 属于 这 种 类 型 。 这 两 种 系统 通常 安 
装 在 用 于 其 他 目的 的 计算 机 上 (如 办 公用 PC 和 家 用 PC), 当 机 器 空闲 时 便 可 为 网 格 自愿 提供 计算 能 
由 于 因特网 上 日益 增强 的 连通 性 ， 即 这 种 自愿 行动 ， 分 布 式 网 格 计算 使 得 数 以 百 万 计 的 家 用 PC 都 可 以 
解决 无 比 复杂 的 数学 问题 和 科学 问题 。 凭 借 云 计 算 〈cloud computing)， 网 络 上 大 量 的 共享 计算 机 得 以 
被 按 需 分 配给 客户 机 使 用 。 云 计算 是 分 布 式 系统 中 的 最 新 趋势 。 就 像 20 世 纪 初 大 城市 电网 的 发 展 使 得 
个 体 工 厂 和 企业 不 再 需要 维护 自己 的 发 电机 一 样 ， 因 特 网 使 得 实体 可 以 将 其 数据 和 计算 委托 给 “ 云 ” 
这 里 的 “ 云 ” 指 的 是 网 络 上 可 用 的 大 量 计算 资源 。 例 如 ,亚马逊 的 弹性 计算 云 (Elastic Compute Cloud ) 
服务 允许 客户 按 小 时 租用 虚拟 计算 机 ， 而 不 需要 考虑 计算 机 硬件 的 实际 位 置 。 男 外 ，Google Drive 和 
Google Apps 人 允许 用 户 在 信息 方面 进行 协作 , 允许 他 们 在 构建 Web 服 务 时 不 需要 了 解 多 少 台 计算 机 在 用 
于 求解 同一 问题 或 相关 数据 存储 在 何 处 。 云 计算 服务 提供 了 合理 的 可 靠 性 和 可 扩展 性 保证 ， 但 却 引发 
了 人 们 对 于 隐私 和 安全 性 的 担忧 , 因为 我 们 也 许 再 也 无 法 知晓 谁 在 拥有 着 、 操 作者 我 们 所 用 的 计算 机 。 


问题 与 练习 

1. 什么 是 开放 式 网 络 ? 

2. 概述 网 桥 和 交换 机 之 间 的 区 别 。 

3. 什么 是 路 由 器 ? 

4. 列举 社会 中 一 些 符合 客户 机 /服务 器 模型 的 关系 。 
5. 列举 社会 中 应 用 的 一 些 协议 。 

6. 概述 集群 计算 和 网 格 计算 之 间 的 区 别 。 
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4.2 因特网 


互联 网 中 最 著名 的 例子 就 是 因特网 (Internet， 注 意 首 字母 是 大 写 的 )， 它 起 源 于 20 世 纪 60 
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年 代 的 研究 项 目 。 它 的 目标 是 开发 出 将 许多 计算 机 网 络 链 接 起 来 的 能 力 ， 以 便 它们 能 作为 一 个 
连接 的 系统 发 挥 作用 ， 而 这 个 系统 不 受 局 部 灾难 的 干扰 。 这 项 工作 的 大 部 分 是 由 美国 政府 资助 
并 通过 美国 国防 部 高 级 研究 计划 局 (Defense Advanced Research Projects Agency，DARPA 一 一 读 
作 “DAR-pa”) 发 起 的 。 这 些 年 来 ， 因 特 网 的 开发 已 经 从 政府 资助 的 项 目 转变 成 了 学 术 研 究 项 
目 ， 而 且 如 今 它 在 很 大 程度 上 已 经 是 商业 项 目 了 ， 用 于 连接 全 世界 个 人 域 网 、 局 域 网 、 城 域 网 及 
广域网 ， 涉 及 数 百 万 台 计 算 机 。 









由 于 因特网 已 经 由 科研 项 目 转变 为 日 常 产 品 ， 科 研 界 也 转向 了 称 为 第 二 代 因 特 网 
(Internet2 ) 的 项 目 。 第 二 代 因 特 网 被 定位 为 纯 学 术 系 统 ， 涉 及 许多 与 工业 及 政府 有 合作 关 
系 的 大 学 。 目 标 是 对 需要 高 带宽 通信 的 因特网 应 用 ( 如 对 诸如 望远镜 和 医学 诊断 仪器 这 样 
昂贵 的 最 新 型 设备 进行 的 远程 访问 及 控制 ) 进行 科研 . 现在 的 一 个 科研 例子 是 : 由 机 械 手 实 
施 远 程 外 科 手 术 ， 机 械 手 模仿 远程 外 科 医 生 的 手 ， 而 外 科 医 生 通 过 视频 观察 病人 。 你 可 以 通 
过 网 站 http://www.internet2.org 了 解 到 更 多 关于 第 二 代 因特网 的 信息 。 


4.2.1 因特网 体系 结构 


我 们 已 经 提 到 ， 因 特 网 是 相连 网 络 的 集合 。 总 体 上 ， 这 些 网 络 的 构建 和 维护 是 由 称 作 因 
特 网 服务 提供 商 (internet service provider，ISP) 的 组 织 来 完成 的 。 就 网 络 本 身 而 言 ， 通 常 也 
习惯 使 用 术语 ISP 来 表示 。 因 此 ， 当 说 到 要 连接 到 一 个 ISP 时 ， 我 们 真正 的 意思 是 连接 到 由 ISP 
所 提供 的 网 络 。 

由 ISP 运 作 的 网 络 系统 可 以 按照 各 网 络 在 整个 因特网 结构 中 所 起 的 作用 分 类 成 一 个 层次 结 
构 〈 见 图 4-7)。 整 个 层次 结构 的 顶部 是 数量 相对 较 少 的 第 一 层 ISP (tier-1 ISP)， 这 些 ISP 拥 有 非 
常 高 速 的 、 高 容量 的 国际 化 广域网 。 这 些 网 络 被 看 成 是 因特网 的 主干 ， 它 们 通常 是 由 通信 行业 
中 的 大 公司 来 运作 的 。 例 如 ， 有 一 家 公司 最 初 是 传统 的 电话 公司 ， 后 来 它 把 服务 领域 扩展 到 提 
供 其 他 通信 服务 。 


第 一 层 1SP 
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图 4-7 因特网 的 构成 
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与 第 一 层 ISP 连 接 的 是 第 二 层 ISP (tier-2 ISP)， 第 二 层 ISP 往 往 是 区 域 性 的 ， 在 能 力 上 更 弱 
一 些 。( 第 一 层 ISP 和 第 二 层 ISP 的 区 别 通常 是 仁者 见 仁 ， 智 者 见 智 。) 此 外 ， 这 些 网 络 通常 也 是 
由 通信 行业 的 公司 运营 。 

第 一 层 ISP 和 第 二 层 ISP 本 质 上 是 路 由 器 的 网 络 ， 集 中 提供 因特网 通信 基础 设施 。 它 们 同样 
可 以 被 认为 是 因特网 的 核心 。 通 常 由 称 为 因特网 接 入 服务 提供 商 (access ISP) 或 第 三 层 ISP (tier-3 
ISP) 的 中 间 商 提供 与 这 一 核心 的 接 入 服务 。 因 特 网 接 入 服务 提供 商 本 质 上 是 独立 的 互联 网 ， 有 
时 也 称 为 内 联网 (intranet)， 由 向 个 人 家 庭 和 企业 提供 因特网 接 入 业务 的 机 构 来 运营 。 这 些 公司 
包括 通过 提供 服务 收取 服务 费 的 有 线 电 视 和 电话 公司 ， 另 外 还 包括 一 些 大 学 或 者 公司 等 组 织 ， 
它们 为 组 织 内 部 的 个 人 用 户 提供 因特网 接 入 。 

个 人 用 户 与 因特网 接 入 服务 提供 商 连 接 的 设备 称 为 终端 系统 (end system) 或 者 主机 (host)。 
这 些 终端 系统 可 能 是 笔记 本 电脑 或 PC， 但 随 着 其 应 用 范围 的 不 断 扩大 ， 终 端 系 统 还 可 能 是 其 他 
很 多 种 设备 ， 如 电话 、 摄 像 机 、 汽 车 和 家 用 电器 。 毕 竟 ， 因 特 网 本 质 上 是 一 个 通信 系统 ， 因 此 
任何 可 以 与 其 他 设备 进行 通信 并 从 中 获 益 的 设备 都 是 潜在 的 终端 系统 。 

终端 系统 与 大 型 网 络 连接 的 技术 也 不 尽 相 同 。 或 许 ， 发 展 最 快 的 是 基于 WiFi 技 术 的 无 线 连 
接 。 策 略 是 将 接 入 点 与 因特网 接 入 服务 提供 商 相 连接 ， 因 此 可 以 在 接 入 点 的 广播 范围 内 通过 因 
特 网 接 入 服务 提供 商 向 终端 系统 提供 因特网 接 入 。 接 入 点 或 接 入 点 组 范围 内 的 区 域 通常 称 为 热 
点 (hot spot)， 尤 其 是 当 这 些 区 域 的 网 络 访问 公开 可 用 或 者 免费 的 时 候 。 在 个 人 住宅 、 酒 店 、 
写字 楼 、 小 型 企业 、 公 园 里 都 可 以 找到 热点 ， 并 且 在 某 些 情况 下 ， 热 点 会 遍布 整 座 城 市 。 目 前 
手机 行业 也 使 用 相似 的 技术 ， 在 手机 行业 中 热点 就 是 我 们 所 知 的 服务 区 ， 当 终端 系统 从 一 个 服 
务 区 移动 到 另 一 个 服务 区 时 ， 通 过 调整 产生 服务 区 的 “路 由 器 ”来 提供 连续 的 服务 。 

连接 因特网 接 入 服务 提供 商 的 其 他 常见 技术 使 用 的 是 电话 线 或 者 电缆 /卫星 系统 。 这 些 技术 
可 以 用 来 提供 到 单个 终端 系统 的 直接 连接 , 或 者 连接 用 户 的 路 由 器 从 而 实现 连接 多 个 终端 系统 。 
后 一 种 方法 在 个 人 住宅 中 的 应 用 日 益 流 行 ， 利 用 现 有 的 电缆 或 者 电话 线 ， 通 过 连接 因特网 接 入 
服务 提供 商 的 路 由 器 / 接 入 点 形成 本 地 热点 。 

20 世 纪 的 电话 、 有 线 电 视 和 卫星 广域网 都 被 设计 为 传送 模拟 通信 信号 ， 如 人 的 语音 或 预 数 
字 (pre-digital) 电视 信号 。 现 代 网 络 可 以 被 设计 成 直接 在 两 台 计 算 机 之 间 传 送 数字 数据 ， 但 较 
旧 的 模拟 网 络 基 础 设施 仍然 是 因特网 的 一 个 重要 组 成 部 分 。 这 些 传统 模拟 链接 所 产生 的 问题 通 
常 被 统称 为 最 后 一 英里 问题 (last mile problem)。 通 过 高 速 数字 技术 《〈 如 光纤 )， 广 域 网 、 城 域 
网 和 许多 局 域 网 的 主干 线 比较 容易 实现 现代 化 ， 但 替换 那些 现 有 的 将 主干 线 连 接 到 个 人 家 庭 或 
办 公 室 的 铜 电话 线 和 同 轴 电缆 的 费用 就 要 昂贵 得 多 。 因 此 , 源 自 远离 终端 的 因特网 大 陆 的 信息 ， 
几乎 整个 旅程 都 在 高 速 数 据 连接 上 ， 就 在 要 到 达 终 端的 这 “最 后 一 英里 ”要 穿越 一 根 慢 速 的 、 
有 百年 历史 的 模拟 电话 线 。 第 2 章 中 提 到 过 ， 已 经 开发 了 几 种 巧妙 的 方案 ， 用 于 扩展 这 些 传统 的 
模拟 链 路 ， 以 适应 数字 数据 的 传输 。DSL 调 制 解 调 器 、 电 线 调制 解 调 器 、 卫 星 上 行 链 路 ， 甚 至 
是 直接 光纤 连接 入 户 都 被 用 于 将 宽带 因特网 接 入 到 终端 用 户 。 


4.2.2 ”因特网 编 址 


如 4.1 节 所 介绍 的 ， 一 个 因特网 需要 一 个 互联 网 范围 的 编 址 系统 ， 为 该 系统 中 的 每 台 计 算 机 
分 配 一 个 唯一 的 标识 地 址 。 在 因特网 中 ， 这 些 地 址 称 为 IP 地 址 (IP address)。( 术 语 IP 的 全 称 是 
Internet Protocol， 指 的 是 因特网 协议 ， 这 个 术语 在 4.4 节 中 会 详细 介绍 。) 最 初 ， 每 一 个 IP 地 址 都 
是 32 位 的 位 模式 ， 但 是 为 了 提供 更 多 的 地 址 ， 人 们 现在 正 计 划 将 其 扩展 到 128 位 〈 见 4.4 节 中 关 
于 IPV6 的 介绍 )。 因 特 网 名 称 与 数字 地 址 分 配 机 构 (Internet Corporation for Assigned Names and 
Numbers，ICANN) 向 因特网 服务 提供 商 提 供 了 大 量 连续 数字 的 人 PP 地址 ， 它 是 一 家 非 营 利 性 的 
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国际 组 织 ， 致 力 于 协调 因特网 的 运营 。 然 后 ， 因 特 网 服务 提供 商 就 可 以 将 其 被 授权 范围 内 的 地 
址 块 中 的 人 P 地 址 分 配给 其 管辖 范围 内 的 机 器 。 因 此 ， 因 特 网 上 的 机 器 都 被 分 配 了 唯一 的 下 地 址 。 

IP 地 址 通常 是 采用 点 分 十 进 制 记 数 法 (dotted decimal notation) 书写 的 ， 其 中 地 址 的 每 个 字 
节 用 圆 点 分 隔 ， 每 个 字 节 用 传统 的 十 进 制 记 数 法 所 表示 的 整数 表示 。 例 如 ， 使 用 点 分 十 进 制 记 
数 法 ， 位 模式 5.2 将 可 以 表示 2 字 节 位 模式 0000010100000010， 其 中 依次 包含 字 节 00000101 (5 的 
表示 ) 和 字 节 00000010 (2 的 表示 ); 而 位 模式 17.12.25 将 可 以 表示 3 字 节 的 位 模式 ， 其 中 依次 包 
含 字 节 00010001 (用 二 进 制 记 数 法 写 的 17)、 字 节 00001100 用 三 进 制 记 数 法 写 的 12)， 以 及 字 
节 00011001 (用 二 进 制 记 数 法 写 的 25)。 总 之 ， 当 用 点 分 十 进 制 记 数 法 表示 时 ，32 位 的 下 地 址 可 
以 表示 为 192.207.177.133。 

用 位 模式 表示 的 地 址 (即使 采用 点 分 十 进 制 记 数 法 压缩 ) 很 难为 人 们 所 用 。 基 于 这 个 原 
因 , 因特网 拥有 男 外 一 种 编 址 系统 ,利用 助 记名 称 来 标识 机 器 。 该 编 址 系统 是 基于 域 (domain) 
的 概念 建立 的 ， 可 以 认为 是 单个 机 构 ( 如 大 学 、 俱 乐 部 、 公 司 或 者 政府 机 构 ) 操作 的 因特网 
“区 域 ”"。( 此 处 区 域 一 词 加 了 引号 ， 这 是 因为 它 可 能 不 同 于 因特网 的 物理 区 域 ， 稍 后 我 们 将 
看 到 这 点 。) 每 一 个 域 都 必须 在 ICANN 进 行 注 册 ， 这 一 过 程 由 称 为 注册 商 (registrar) 的 公司 
操作 ， 注 册 商 由 ICANN 指 定 。 作 为 注册 流程 的 一 部 分 ， 助 记 域 名 (domain name) 会 分 配给 
域 , 域名 在 因特网 中 是 唯一 的 。 域 名 通常 是 注册 域 的 机 构 的 描述 ， 从 而 提高 它们 对 人 类 的 实 
用 性 。 

例如 ， 马 凯特 大 学 的 域名 是 mu.edu。 需 要 注意 的 是 点 后 面 的 后 级 ， 它 反映 了 域 的 分 类 ， 在 
这 个 域名 中 ， 后 级 edu 就 表明 了 它 是 一 家 教育 (educational) 机 构 。 这 些 后 级 称 为 项 级 域名 
(Top-Level Domain，TLD)。 其 他 顶级 域名 包括 ， 表 示 商 业 机 构 的 com， 表 示 政 府 机 构 的 gov， 
表示 非 营 利 机 构 的 org， 表示 博物 馆 的 museum， 表示 无 限制 使 用 的 ijnfo, 以 及 最 初 打 算 用 于 表 
示 ISP 但 是 现在 使 用 范围 更 广 一 些 的 net。 除 了 这 些 一 般 的 TLD 外 ， 也 有 用 于 表示 特定 国家 的 2 
字母 TLD， 称 为 国家 代码 顶级 域名 (country-code TLD)， 如 表示 澳大利亚 的 au， 以 及 表示 加 拿 
大 的 ca。 

一 旦 一 个 域 的 助 记名 被 注册 ， 注 册 该 域名 的 机 构 就 可 以 在 域内 自由 扩展 名 称 ， 为 个 体 项 获 
取 助 记 标识 符 。 例 如 ， 马 凯特 大 学 内 的 某 台 主机 可 以 标识 为 eagle .mu.edu。 注意 ,域名 是 向 左 
扩展 的 ， 并 用 圆 点 分 开 。 在 一 些 情况 下 ， 使 用 称 为 子 域 (subdomain) 的 多 个 扩展 在 域内 组 织 
称 。 这 些 子 域 通常 代表 域 管辖 内 不 同 的 网 络 。 例 如 ， 如 果 Yoyodyne 公 司 被 分 配 的 域名 为 
yoyodyne .com， 那 么 Yoyodyne 的 某 台 计算 机 的 域名 可 以 为 overthruster.propulsion. 
yoyodyne .com, 其 含义 是 计算 机 overthruster 在 顶级 域名 com 的 yoyodyne 域 的 propulsion 
子 域内 。( 我 们 需要 注意 的 是 , 在 助 记 地 址 中 使 用 的 点 分 表示 法 与 在 位 模式 形式 的 地 址 中 使 用 的 
点 分 十 进 制 记 数 法 没有 关系 。) 

虽然 助 记 地 址 对 于 人 类 来 说 比较 方便 ， 但 是 因特网 中 还 是 使 用 人 P 地 址 来 传送 消息 。 因 此 ， 
如 果 某 人 想 要 给 远程 机 器 发 送 消 息 并 通过 助 记 地 址 来 标识 目的 地 ， 那 么 使 用 的 软件 必须 能 够 在 
发 送 消 息 之 前 将 助 记 地 址 转换 成 IP 地 址 。 这 种 转换 可 以 通过 域名 服务 器 (name server) 来 完成 ， 
其 实 它 是 可 以 向 客户 端 提供 地 址 转换 服务 的 目录 。 这 些 域名 服务 器 被 统统 用 作 因特网 范围 内 的 
目录 系统 ， 称 为 域名 系统 (domain name system，DNS)。 使 用 域名 系统 进行 转换 的 过 程 称 为 域 
名 系统 查找 (DNS lookup)。 

因此 ， 如 果 一 台 机 器 可 以 通过 助 记 域名 连接 ， 那 么 这 个 域名 必须 存在 于 域名 系统 内 的 域名 
服务 器 上 。 在 注册 了 域名 的 实体 拥有 资源 的 情况 下 ， 可 以 在 域内 建立 并 维护 包含 所 有 名 称 的 域 
名 服务 器 。 事实 上 , 这 就 是 域名 系统 最 初 构建 所 用 的 模型 。 每 一 个 注册 域 都 代表 了 地 方 当 局 (如 
公司 、 大 学 或 者 政府 机 构 ) 所 运行 的 一 个 因特网 的 物理 区 域 。 实 际 上 ， 这 个 当局 就 是 一 个 因 特 
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网 接 入 服务 提供 商 ， 通 过 与 因特网 链接 的 内 联网 向 其 成 员 提 供 因 特 网 接 入 。 作 为 该 系统 的 一 部 
分 ， 组 织 维护 自己 的 域名 服务 器 ， 为 域 中 使 用 的 所 有 名 称 提供 转换 服务 。 

目前 ， 这 种 模式 依然 很 常见 。 然 而 ， 许 多 个 体 或 者 小 型 组 织 想 要 建立 展示 在 因特网 上 的 域 ， 
但 却 不 想 承 担 必要 的 支持 资源 。 例 如 ， 一 家 本 地 国际 象棋 俱乐部 想 要 在 因特网 上 展示 为 
Kingsandoueens .org， 但 是 俱乐部 很 可 能 没有 “建立 自己 的 网 络 、 维 护 网 络 与 因特网 的 链接 
以 及 实现 其 自己 的 域名 服务 器 ”的 资源 。 这 种 情况 下 ， 俱 乐 部 可 以 和 因特网 接 入 服务 提供 商 签 
订 合 同 ， 使 用 因特网 服务 提供 商 已 经 建 好 的 资源 实现 注册 域名 的 展示 。 俱 乐 部 一 般 可 能 会 通 
过 因特网 服务 提供 商 的 帮助 ， 注 册 由 俱乐部 选 好 的 域名 ， 并 与 因特网 服务 提供 商 签订 合同 ， 
将 域名 放 入 因特网 服务 提供 商 的 域名 服务 器 。 这 就 意味 着 所 有 关于 新 域名 的 域名 系统 查找 都 会 
指向 因特网 服务 提供 商 的 域名 服务 器 ， 从 而 获取 正确 的 域名 转换 。 通 过 这 种 方法 ， 许 多 注册 的 
域名 就 可 以 存在 于 一 个 因特网 服务 提供 商 的 域名 服务 器 中 ， 每 个 域名 只 占用 一 台 计 算 机 的 很 小 
一 部 分 。 


4.2.3 ”因特网 应 用 


在 因特网 发 展 的 早期 ， 大 多 数 应 用 都 是 分 开 的 简单 程序 ， 每 个 应 用 都 遵循 一 个 网 络 协议 。 
新 闻 阅 读 器 应 用 使 用 网 络 新 闻 传 送 协议 (Network News Transfer Protocol，NNTP) 联系 服务 器 ， 
用 于 通过 网 络 来 列 出 和 复制 文件 的 应 用 实现 了 文件 传送 协议 〈File Transfer Protocol，FTP)， 用 
于 访问 远 距 离 的 男 一 台 计 算 机 的 应 用 使 用 了 远程 登录 (Telnet) 协议 ， 后 来 又 有 了 安全 外 壳 
(Secure Shell，SSH) 协议 。 由 于 Web 服 务 器 和 浏览 器 变 得 越 来 越 成 熟 ， 越 来 越 多 的 传统 网 络 应 
用 开始 通过 网 页 和 强大 的 超 文 本 传送 协议 (Hyper Text Transfer Protocol，HTTP ) 来 处 理 。 然 而 ， 
在 刚 开始 研究 因特网 应 用 的 网 络 协议 时 , 我 们 有 必要 在 下 一 节 介绍 HTTP 之 前 先 介绍 几 个 比较 简 
单 的 例子 。 

1. 电子 邮件 

现在 有 很 多 系统 可 以 通过 网 络 交 换 两 个 终端 用 户 之 间 的 消息 , 即时 消息 (Instant Messaging， 
IM)、 基 于 浏览 器 的 在 线 聊 天 、 基 于 Twitter 的 “tweet” 以 及 Facebook 的 “wall” 就 是 其 中 的 几 个 。 
因特网 最 古老 、 最 持久 的 用 途 之 一 就 是 电子 邮件 系统 ， 简 称 电子 邮件 〈email)。 虽 然 许 多 用 户 
现在 依靠 他 们 的 浏览 器 或 者 复杂 的 应 用 程序 (如 微软 的 Outlook、 苹 果 的 Mail 或 者 Mozilla 的 
Thunderbird) 来 阅读 和 撰写 他 们 的 电子 邮件 ， 但 电子 邮件 信息 在 因特网 上 从 一 台 计 算 机 实际 发 
送 到 另 一 台 计 算 机 时 ， 使 用 的 仍然 是 像 简单 邮件 传送 协议 这 样 的 基本 网 络 协议 。 

简单 邮件 传送 协议 (Simple Mail Transfer Protocol，SMTP ) 定义 了 一 种 方法 ， 通 过 这 种 方 
法 ， 网 络 上 的 两 台 计 算 机 可 以 在 将 一 个 电子 邮件 信息 从 一 台 主 机 传送 到 另外 一 台 主 机 的 时 候 进 
行 交 互 。 考 虑 邮件 服务 器 (mail server) mai1.skaro.gov 将 一 封 电子 邮件 从 终端 用 户 “dalek?” 
发 送 给 域 tardis .edu 的 终端 用 户 “doctor” 的 例子 。 首 先 ，mail.skaro.gov 上 的 一 个 邮件 
处 理 进程 联系 mail .tardis .edu 上 的 邮件 服务 器 进程 。 为 此 ， 它 使 用 域名 系统 ( 男 一 个 网 络 协 
议 ) 将 人 类 可 读 的 目的 域名 映射 为 正确 的 邮件 服务 器 名 ， 然 后 再 映射 到 它 的 他 地 址 。 这 与 拨号 
前 查找 一 个 熟人 电话 号 码 没有 什么 不 同 。 同 样 ， 当 另 一 端的 服务 器 进程 应 答 时 ， 协 议 规定 ， 它 
必须 向 调用 者 标识 自己 。 它 们 的 SMTP 交 换 的 转换 可 能 看 起 来 像 这 样 : 

1 220 mail.tardis.edu SMTP Sendmail Gallifrey-1.0; Fri, 23 


Aug 2413 14:34:10 
2 HELO mail.skaro.gov 





3 250 mail.tardis.edu Hello mail.skaro.gov, pleased to meet you 
4 MAIL From: dalek@skaro.gov 
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5 250 2.1.0 dalek@skaro.gov... Sender ok 
6 RCPT To: doctor@tardis.edu 
7 250 2.1.5 doctor@tardis.edu... Recipient ok 
8 DATA 

9 354 Enter mail, end with "." on a line by itself 
10 Subject: Extermination. 


12 EXTERMINATE! 
13 Regards, Dalek 


15 250 2.0.0 r7NJYAE1028071 Message accepted for delivery 
16 QUIT 


17 221 2.0.0 mail.tardis.edu closing connection 


在 第 1 行 ， 远程 邮件 服务 器 进程 在 应 答 调 用 者 时 ， 宣 布 了 它 的 名 字 、 它 所 使 用 的 协议 以 及 其 
他 选项 信息 ， 如 协议 版 本 、 日 斯 和 时 间 。 在 第 2 行 ， 发 送 邮 件 服务 器 进程 介绍 了 它 自己 。 在 第 3 
行 ， 远 程 服务 器 确认 了 发 送 服务 器 的 名 字 。 

大 多 数 因特网 协议 都 不 必用 ASCII 字 符 发 送 ， 所 以 很 容易 被 人 理解 。 当 然 ， 第 3 行 中 的 那个 
古怪 的 礼貌 用 语 “pleased to meet you” 既 不 会 受 这 个 连接 两 端的 软件 的 欣赏 ,也 不 是 SMTP 
的 正常 功能 所 必要 的 。 但 是 ， 这 是 一 个 流行 的 SMTP 邮 件 服务 器 内 置 的 实际 行为 ， 是 因特网 初 
期 留 下 来 的 ， 那 时 人 工 操作 员 需 要 频繁 地 通过 审查 SMTP 转 换 来 调试 两 个 邮件 服务 器 之 间 的 不 
兼容 性 。 这 样 的 交换 每 天 在 网 络 上 发 生 无 数 次 ， 只 有 负责 在 整个 因特网 上 传输 电子 邮件 的 软件 
代理 才能 够 知道 确切 的 数字 。 

在 这 个 最 简单 的 案例 中 ,远程 邮件 服务 器 将 听信 于 第 2 行 中 的 mail.skaro.gov， 接 受 发 送 
服务 器 是 来 自 域 skaro .gov 的 名 为 mail 的 机 器 。SMTP 是 建立 在 信任 基础 上 的 典范 ， 但 后 来 被 
垃圾 邮件 发 送 者 和 其 他 因特网 的 不 法 之 徒 滥用 。 现 代 邮 件 服务 器 必须 使 用 SMTP 的 扩展 版 本 或 
者 与 其 同等 的 协议 来 帮助 确保 电子 邮件 被 安全 发 送 。 在 本 章 的 最 后 部 分 ， 我 们 将 会 对 有 关 网 络 
安全 性 的 问题 进行 更 详细 的 讨论 。 

返回 到 转换 , 在 第 4 行 , 发 送 服务 器 宣布 它 有 一 个 邮件 信息 要 传递 , 并 标识 了 这 个 发 送 用 户 。 
在 第 5 行 ， 远 程 服务 器 确认 它 将 接收 来 自 这 个 域 的 这 个 用 户 的 邮件 。 在 第 6 行 ， 发 送 服务 器 宣布 
了 远程 服务 器 上 的 收 件 人 。 在 第 7 行 ， 远程 服务 器 确认 它 将 接收 发 往 那 个 用 户 的 电子 邮件 。 在 第 
8 行 ， 发 送 服务 器 免除 了 介绍 ， 并 宣布 它 准备 发 送 DATA， 即 电子 邮件 信息 的 实体 。 在 第 9 行 ， 远 
程 服务 器 (用 第 354 行 代码 ， 根 据 SMTP) 确认 它 已 准备 好 接收 该 信息 体 ， 此 外 该 行 还 包含 了 一 
个 有 用 的 关于 如 何 结束 该 信息 传送 的 人 类 可 读 指令 。 

在 第 10 一 14 行 ， 发 送 服务 器 传送 要 交付 的 电子 邮件 信息 文本 。 远 程 服 务 器 在 第 15 行 确认 接 
受 ， 在 第 17 行 确认 发 送 服务 器 在 第 16 行 宣布 的 QUIT。 

描述 SMTP 的 技术 文档 定义 了 像 上 面 转换 那样 的 对 话 中 的 每 个 允许 的 步骤 。 根 据 关 键 字 
HELO、MAIL、RCPT、DATA 和 QUIT 将 被 如 何 发 送 、 可 以 带 哪 些 选项 以 及 应 该 被 如 何 解 释 ， 对 这 
些 关 键 字 进行 了 精确 的 定义 。 同 样 ， 远 程 服务 器 用 于 确认 的 数字 响应 码 也 是 枚 举 定义 的 。 软 件 
设计 者 使 用 协议 描述 来 开发 可 正确 实现 通过 网 络 发 送 和 接收 电子 邮件 的 算法 。 

电子 邮件 传输 的 其 他 方面 采用 了 其 他 协议 。 因 为 SMTP 最 初 是 为 传送 ASCII 编 码 的 文本 信息 
而 设计 的 ， 所 以 又 开发 了 多 用 途 因特网 邮件 扩展 (multipurpose Internet mail extensions，MIME ) 等 
协议 ， 将 非 ASCII 编 码 的 数据 转换 成 SMTP 兼 容 的 格式 。 

有 两 种 常见 的 协议 可 以 用 于 访问 已 到 达 并 积累 在 用 户 邮件 服务 器 里 的 电子 邮件 ， 它 们 是 邮 
局 协议 第 3 版 (post office protocol version 3，POP3 ) 和 因特网 邮件 访问 协议 (Internet mail access 
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Protocol，IMAP)。 二 者 中 ，POP3 〈 读 作 “pop-THREE”) 较为 简单 。 使 用 POP3， 用 户 可 以 向 
其 本 地 计算 机 传送 〈 下 载 ) 信息 ， 在 本 地 计算 机 中 ， 这 些 信息 可 以 被 读 取 、 被 存储 在 不 同 的 文 
件 夹 中 、 被 编辑 ， 还 可 以 按照 用 户 的 需要 进行 其 他 操作 。 这 些 操 作 都 是 通过 使 用 本 地 机 器 的 海 
量 存储 器 在 用 户 的 本 地 机 器 上 完成 的 。IMAP ( 读 作 “EYE-map”) 支持 用 户 在 与 邮件 服务 器 相 
同 的 机 器 上 存储 和 操作 信息 以 及 相关 的 资料 。 这 样 ， 必 须 从 不 同 计算 机 上 访问 邮件 的 用 户 ， 就 
可 以 在 邮件 服务 器 上 维护 记录 ， 并 通过 任何 一 台 远 程 计 算 机 访问 。 

2. VolP 

下 面 来 看 一 个 较 近 的 因特网 应 用 的 例子 一 一 因特网 协议 语音 voice over Internet protocol， 
VoIP)， 它 利用 因特网 基础 设施 提供 与 传统 电话 系统 类 似 的 语音 通信 。 最 简单 的 形式 下 ，VoIP 
由 不 同 机 器 上 的 两 个 进程 构成 ， 这 些 机 器 通过 P2P 模 型 传送 音频 数据 一 一 这 种 方法 本 身 没有 明 
显 的 问题 。 但 是 ， 初 始 化 和 接收 呼叫 ， 把 VoIP 与 传统 电话 系统 对 接 ， 以 及 提供 像 紧 急 911 通 信 这 
样 的 服务 ， 诸 如 此 类 的 任务 都 是 超出 了 传统 的 因特网 应 用 范畴 的 问题 。 此 外 ， 在 美国 ， 拥 有 国 
家 传统 电话 公司 的 政府 把 VoIP 看 成 一 种 威胁 ， 对 它们 征收 很 高 的 税 ， 或 彻底 宣布 它们 不 合法 。 

现在 有 4 种 不 同形 式 的 VoIP 系统 在 竞争 。VoIP 软 电话 〈soft phone) 由 P2P 软 件 构成 ， 人 允许 两 
个 或 多 个 PC 共享 一 个 电话 ， 所 需 硬 件 只 是 一 个 扬声器 和 一 个 麦克 风 。VolIP 软 电话 系统 的 一 个 例 
子 就 是 Skype， 它 还 为 客户 提供 与 传统 电话 通信 系统 的 链接 。Skype 的 一 个 缺点 是 它 是 一 个 专 有 
系统 ， 因 而 它 的 许多 操作 结构 是 不 对 外 公开 的 , 这 意味 着 Skype 用 户 必须 要 在 没有 第 三 方 证 明 的 
基础 上 相信 Skype 软 件 的 完整 性 。 例 如 ， 为 了 接收 呼叫 ，Skype 用 户 必须 把 PC 与 因特网 相连 ， 供 
Skype 系 统 使 用 ， 这 就 意味 着 在 PC 机 主 毫 无 意识 的 情况 下 ，PC 的 一 些 资源 可 能 会 被 用 来 支持 其 
他 的 Skype 通 信 (这 一 功能 已 经 引起 了 一 些 抵触 )。 

第 二 种 形式 的 VoIP 由 模拟 电话 适配器 (analog telephone adapter) 构成 ， 模 拟 电话 适配器 人 允 
许 用 户 将 其 传统 电话 连接 到 由 某 个 因特网 接 入 服务 提供 商 提供 的 电话 服务 上 。 这 一 选择 经 常 与 
传统 的 因特网 服务 和 /或 数字 电视 服务 捆绑 。 

第 三 种 形式 的 Vo 了 是 嵌入 式 VoPP 电 话 ， 和 骸 入 式 VoIP 电 话 把 传统 电话 替换 成 了 直接 连接 到 
TCP/P 网 络 上 的 等 效 的 手持 设备 。 嵌 入 式 VoIP 电 话 在 大 型 组 织 中 越 来 越 常见 ， 很 多 大 型 组 织 都 
在 将 其 传统 的 内 部 铜 线 电话 系统 替换 为 基于 以 太 网 的 VoIP， 以 降低 成 本 并 增强 功能 。 

最 后 ， 目 前 这 一 代 智 能 手机 使 用 的 是 无 线 VoIP 技 术 。 也 就 是 说 ， 早 期 的 几 代 无 线 电话 仅 使 
用 特定 公司 的 协议 与 该 电话 公司 的 网 络 通信 。 通 过 该 公司 的 网 络 和 因特网 间 的 网 关 ， 我 们 便 可 
以 接 入 因特网 ,而 信号 会 在 那儿 被 转换 为 TCP/IP 系 统 。 然 而,， 4G 电话 网 络 是 完全 基于 IP 的 网 络 ， 
即 4G 电 话 本 质 上 只 是 全 球 因 特 网 上 接 入 宽带 的 另 一 台 主 机 。 

3. 因特网 多 媒体 流 

当前 因特网 上 的 音频 和 视频 的 实时 传输 占用 了 相当 大 的 一 部 分 因特网 流量 ， 这 种 传输 被 称 
作 流 〈streaming)。 仅 Netflix 一 家 网 站 在 2013 年 的 前 3 个 月 就 给 终端 用 户 传送 了 40 亿 小 时 的 节目 。 
如 果 再 加 上 YouTube， 那 么 这 两 个 服务 将 会 用 掉 2014 年 一 半 以 上 的 因特网 带宽 。 


备 以 来 ， 移动 电话 技术 得 到 了 迅速 的 发 





到 了 现在 这 人 一 人 无 线 电 话 网 络 通过 空气 传输 模拟 语音 信和 号 ， 
与 传统 的 电话 系统 非常 相似 ， 只 是 没有 穿 寺 而 过 的 多 线 我 们 把 这 些 早期 的 电话 称 为 “1G”， 
即 第 一 代 。 第 二 代 使 用 数字 信号 对 语音 编码 ， 能 够 更 高 效 地 使 用 无 线 电波 ， 还 能 够 传输 其 他 
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种 类 的 数字 数据 ， 如 文本 消息 ,第 三 代 (3G ) 电话 网 络 提供 了 更 高 的 数据 速率 ， 支 持 手机 视 
频 通 话 和 其 他 带宽 密集 型 活动 。4G 网 络 提供 了 更 高 的 数据 速率 和 一 个 完全 的 分 组 交换 玫 网 
络 ， 它 允许 智能 手机 利用 从 前 只 有 支持 宽带 的 PC 才 有 的 连接 性 和 灵活 性 。 


从 表面 上 看 ， 因 特 网 流 似乎 不 需要 特殊 的 考虑 。 例 如 ， 人 们 可 能 猜想 ， 一 个 因特网 无 线 站 
点 仅 需 建立 一 台 能 把 节目 消息 发 送 给 请 求 它们 的 每 个 客户 端的 服务 器 即 可 。 这 种 技术 称 作 NN 单 
播 (N-unicast)。( 严 格 地 说 ， 单 播 是 指 一 个 发 送 者 向 一 个 接收 者 发 送 消息 ， 而 N 单 播 是 指 一 个 发 
送 者 参与 多 个 单 播 。) N 单 播 方法 已 经 投入 实际 使 用 ， 但 这 种 方法 有 缺陷 ， 它 把 大 量 的 负担 放 在 
了 站 点 服务 器 和 与 服务 器 紧邻 的 因特网 邻居 上 。 实 际 上 ，N 单 播 强 迫 服务 器 按照 实时 基准 把 各 条 
消息 发 送 给 它 的 每 个 客户 端 ， 而 所 有 这 些 消 息 必须 再 由 服务 器 的 邻居 们 转发 。 

NN 单 播 的 大 多 数 候选 方法 都 是 试图 缓解 这 个 问题 。 其 中 一 种 方法 是 使 用 过 去 的 文件 共享 系 
统 方法 中 的 P2P 模 型 。 也 就 是 说 ， 一 旦 一 个 对 等 体 接收 到 数据 ， 它 就 开始 把 数据 分 布 到 那些 仍 
在 等 待 的 对 等 体 ， 这 意味 着 许多 分 布 问题 从 数据 源 转 移 到 了 对 等 体 。 

另外 一 种 候选 方法 称 为 多 播 (multicast), 它 把 分 布 问 题 转移 给 了 因特网 路 由 器 。 使 用 多 播 ， 
服务 器 通过 单个 地 址 把 一 个 消息 传送 给 多 个 客户 端 ， 依 赖 因特网 中 的 路 由 器 来 识别 这 个 地 址 的 
含义 ， 产 生 消息 的 副本 并 将 其 转发 到 合适 的 目的 地 。 注 意 ， 依 赖 多 播 的 应 用 需要 因特网 路 由 器 
有 具 有 超过 它 原 来 职责 范围 的 功能 。 多 播 在 小 型 网 络 中 已 经 实现 ， 但 还 没有 扩展 到 全 球 因 特 网 。 

更 重要 的 是 ， 这 一 类 中 的 大 多 数 应 用 现在 都 是 点 播 流 on-demand streaming)， 点 揪 流 中 的 
a pe a td pe 这 是 一 个 与 因特网 无 线 站 点 截然 不 同 
的 问题 ， 因 为 每 个 终端 用 户 都 希望 能 够 根据 自己 的 节奏 来 开始 、 和 暂停 或 回放 内 容 。 在 这 种 情况 
ee 每 个 点 播 流 就 是 能 有 效 地 从 有 存储 着 内 容 的 媒体 服务 器 
到 希望 得 到 它 的 终端 用 户 的 单 播 。 

为 了 将 这 种 类 型 的 流 扩 展 到 几 千 甚至 几 百 万 的 并 发 用 户 ， 每 个 人 都 有 自己 的 个 人 流 ， 必 须 
将 内 容 复制 到 许多 不 同 的 服务 器 。 大 规模 流 服务 利用 内 容 分 发 网 络 〈content delivery network， 
CDN) 来 工作 ， 通 过 战略 性 地 分 布 因特网 上 的 各 个 服务 器 组 ， 专 门将 内 容 副本 流传 输 到 附近 的 
在 服务 器 组 的 网 络 “邻居 ”中 的 终端 用 户 。 在 许多 情况 下 ，CDN 机 器 可 驻 留 在 一 个 因特网 接 入 
服务 提供 商 的 网 络 中 ， 人 允许 那个 因特网 接 入 服务 提供 商 的 客户 通过 流 从 附近 的 服务 器 (在 网 络 
中 , 这 台 服 务 器 比 流 服务 器 的 中 央 服 务 器 机 器 距 客 户 的 距离 近 得 多 ) 高 速 下 载 多 媒体 内 容 副 本 。 
有 一 种 称 为 任 播 (anycast) 的 网 络 技 术 ， 能 使 终端 用 户 自 动 连接 到 一 个 规定 的 服务 器 组 之 外 的 
最 近 一 台 服 务 器 ， 让 CDN 更 实用 。 

a 点 播 视频 流 的 渗透 已 远 超 传统 PC。 一 大 类 骨 入 式 设备 ， 如 各 种 电视 机 、DVD/ 
蓝光 播放 机 、 智 能 手机 、 游 戏 控制 台 ， 现 在 都 可 以 直接 连接 到 TCP/IP 网 络 ， 以 便 从 众多 的 免费 
ee 


问题 与 练习 


. 第 一 层 ISP 和 第 二 层 ISP 的 作用 是 什么 ? 因特网 接 入 服务 提供 商 的 作用 是 什么 ? 

, 什么 是 DNS? 

. 在 点 分 十 进 制 记 数 法 中 ，3.6.9 代 表 什 么 位 模式 ? 用 点 分 十 进 制 记 数 法 表示 位 模式 0001010100011100。 

. 计算 机 在 因特网 中 的 助 记 地 址 (如 overthruster.propulsion.yoyodyne.com) 的 结构 在 哪 方 面 
与 传统 的 邮寄 地 址 相似 ? 在 耳 地 址 中 会 出 现 同 样 的 结构 吗 ? 

. 列 出 因特网 上 发 现 的 3 种 服务 器 ， 并 说 出 每 种 的 用 途 。 

. 协议 描述 了 网 络 通信 的 哪些 方面 ? 


人 iD 一 


OO 
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7. 因特网 无 线 广播 的 P2P 和 多 播 方法 与 N 单 播 在 广播 方式 上 有 何不 同 ? 
8. 当 要 在 4 种 VoIP 中 选择 一 种 时 ， 应 该 考虑 什么 标准 ? 


4.3 万 维 网 

万 维 网 源 于 蒂 姆 。 伯 纳 斯 - 李 (Tim Berners-Lee) 所 作出 的 努力 ， 他 意识 到 了 将 互联 网 技术 
与 称 为 超 文本 〈hypertext) 的 链接 文档 的 概念 结合 会 产生 巨大 的 潜力 。 他 于 1990 年 12 月 发 布 了 
第 一 个 万 维 网 的 实现 软件 。 虽 然 这 个 早期 原型 还 不 支持 多 媒体 数据 ， 但 它 包 括 了 我 们 现在 公认 
的 万 维 网 的 关键 组 成 部 分 ， 超 文本 文档 格式 ， 用 于 把 超 链接 (hyperlink) 嵌入 到 其 他 文档 ; 协 
议 ， 用 于 通过 网 络 传送 超 文本 ; 服务 器 进程 ， 用 于 根据 请 求 提 供 超 文 本 页 面 。 从 这 个 不 起 眼 的 


软件 开始 ， 万 维 网 迅速 成 长 为 支持 图 像 、 音 频 和 视频 的 系统 ， 到 20 世 纪 90 年 代 中 期 ， 已 经 成 为 
推动 因特网 发 展 的 主要 应 用 。 


4.3.1 万 维 网 实现 


允许 用 户 访问 因特网 上 超 文本 的 软件 包 分 为 两 类 : 浏览 器 (browser) 和 万 维 网 服务 器 
(webserver)。 浏 览 器 安装 在 用 户 的 计算 机 上 ， 负 责 获取 用 户 请 求 的 材料 ， 并 将 这 些 材 料 条 理 清 
晰 地 展示 给 用 户 。 常 见 的 因特网 浏览 器 包括 : Firefox、Safari 和 Internet Explorer。 万 维 网 服务 器 
驻 留 在 含有 待 访问 的 超 文本 文档 的 计算 机 中 。 它 的 任务 是 根据 客户 端 〈 浏 览 器 ) 的 请 求 提供 对 
机 器 里 文档 的 访问 权 。 超 文本 文档 通常 使 用 超 文本 传送 协议 CHypertext Transfer Protocol, HTTP) 
在 浏览 器 与 万 维 网 服务 器 之 间 传 送 。 

为 了 在 万 维 网 上 定位 及 检索 文档 ， 每 个 文档 都 被 赋予 了 一 个 唯一 的 称 为 统一 资源 定位 地 址 
(Uniform Resource Locator，URL) 的 地 址 。 每 个 URL 都 包含 浏览 器 要 联系 正确 服务 器 和 请 求 所 
需 文档 所 需要 的 信息 。 因 此 ， 为 了 浏览 网 页 ， 人 们 首先 要 给 浏览 器 提供 所 需 文 档 的 URL， 然 后 
要 求 该 浏览 器 检索 和 显示 这 个 文档 。 

图 4-8 给 出 了 一 个 典型 的 URL， 它 包含 以 下 4 段 : 用 于 与 控制 文档 访问 的 服务 器 进行 通信 的 
协议 ， 服 务 器 所 在 机 器 的 助 记 地 址 ， 服 务 器 在 查找 包含 该 文档 的 目录 时 所 需 的 目录 路 径 ， 以 及 
该 文档 本 身 的 名 字 。 简 言 之 ,图 4-8 中 的 URL 告 知 浏览 器 : 使 用 HTTP 协 议 与 称 为 eagle.mu.edu 
的 计算 机 上 的 万 维 网 服务 器 联系 ， 并 检索 名 为 Julius_Caesar .html 的 文档 ， 该 文档 存放 在 
authors 目 录 的 Shakespeare 子 目录 中 。 





http://eagle.mu.edu/authors/Shakespeare/Julius Caesar.html 


\ 1 SN 
保存 该 文档 的 主机 助 记 符 文档 名 
访问 该 文档 所 需要 的 目录 路 径 ， 指 示 该 文档 在 
协议 ， 这 里 是 超 文本 该 主机 文件 系统 中 的 位 置 
传送 协议 (http) 


图 4-8 一 个 典型 的 URL 


有 时 ，URL 可 能 不 会 明确 包含 图 4-8 中 所 示 的 所 有 段 。 例 如 ， 如 果 服 务 器 不 需要 根据 目录 路 
径 就 能 读 到 那个 文档 ， 那 么 URL 中 就 不 会 出 现 目录 路 径 。 此 外 ， 有 时 一 个 URL 只 包含 一 个 协议 
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以 及 一 台 计 算 机 的 助 记 地 址 。 在 这 些 情况 下 , 该 计算 机 的 万 维 网 服务 器 将 返回 一 个 预定 的 文档 ， 
该 文档 一 般 称 为 主页 ， 通 常 描述 该 网 站 上 可 用 的 信息 。 这 种 缩短 的 URL 提 供 了 一 种 简单 的 联系 
机 构 的 方法 。 例 如 ，http://www.google.com 这 个 URL 将 指向 谷歌 公司 的 主页 ， 它 包含 许多 
与 该 公司 相关 的 服务 、 产 品 和 文档 的 超 链接 。 

为 了 进一步 简化 网 站 定位 ， 许 多 浏览 器 都 假定 : 如 果 没 有 明确 说 明 协 议 ， 就 使 用 HTTP 协 议 。 
当 给 定 的 “URL” 只 包含 www.google.com 时 ， 这 些 浏览 器 也 能 正确 地 检索 到 谷歌 公司 的 主页 。 






万 维 网 联盟 ( World Wide Web Consortium，W3C ) 创建 于 1994 年 ， 宗 旨 是 通过 开发 协议 
标准 ( 称 为 W3C 标 准 ) 来 促进 万 维 网 的 发 展 。W3C 总 部 设 在 瑞士 日 内 瓦 欧洲 粒子 物理 研究 所 
(CERN ) 高 能 粒子 物理 实验 室 . CERN 是 原来 的 HTML 标 记 语 言 和 用 于 在 因特网 上 传送 HTML 
文档 的 HTTP 协 议 的 诞生 地 。 今 天 的 W3C 制 订 了 许多 标准 (包括 用 于 XML 和 许多 多 媒体 应 用 
的 标准 )， 这 些 标准 使 得 大 量 因 特 网 产品 彼此 兼容 。 在 网 站 http://www.w3c.org 上 ， 你 可 
以 了 解 到 关于 W3C 的 更 多 信息 。 


4.3.2 HTML 


传统 的 超 文 本 文档 类 似 于 文本 文档 ， 因 为 它 的 正文 是 使 用 诸如 ASCII[ 或 者 Unicode 这 样 的 系 
统一 个 字符 接 一 个 字符 地 编码 的 。 区 别 是 ， 超 文本 文档 还 包含 称 为 标签 (tag) 的 特殊 符号 ， 
用 于 描述 该 文档 应 该 如 何 呈 现在 显示 屏 上 ， 该 文档 还 需要 什么 多 媒体 资源 (如 图 像 )， 以 及 该 文 
档 的 哪些 项 被 链接 到 了 其 他 文档 上 。 这 个 标签 系统 称 为 超 文 本 标记 语言 (Hypertext Markup 
Language，HTML )。 

因此 ， 按 照 HTML 的 要 求 ， 网 页 的 作者 要 描述 浏览 器 所 需要 的 信息 ， 使 得 浏览 器 能 够 将 该 
页 呈现 在 用 户 的 屏幕 上 ， 并 找到 当前 网 页 所 引用 的 任何 相关 文档 。 该 过 程 类 似 于 向 纯 输入 文本 
中 加 入 排版 说 明 (也 许 是 用 红 笔 )， 以 便 排版 人 员 知 道 文档 最 后 应 该 以 什么 形式 出 现 。 对 于 超 文 
本 ，HTML 标 签 就 是 红色 记号 ， 浏 览 器 最 终 充 当 了 排版 人 员 的 角色 ， 读 取 HTML 标 签 就 会 知道 
文本 应 以 什么 方式 呈现 在 计算 机 屏幕 上 。 

图 4-9a 给 出 了 一 个 极其 简单 的 网 页 的 HTML 编 码 版 本 ， 称 为 源 (source) 版 本 。 注 意 ， 
标签 是 用 符号 “<” 和 “>” 来 划 定 的 。HTML 源 文档 由 两 部 分 组 成 一 一 头 ( 在 <head> 和 
</head> 标 签 之 间 ) 和 体 (在 <body> 和 </body> 标 签 之 间 )。 网 页 的 头 和 体 之 间 的 区 别 类 
似 于 各 办 公 室 间 备 忘 录 的 头 和 体 之 间 的 区 别 ， 两 者 都 是 : 头 包 含 文档 的 预备 性 信息 〈 如 备 
忘 录 的 日 期 、 主 题 等 ); 体 包含 文档 的 实质 内 容 ， 对 于 网 页 就 是 该 页 可 能 会 呈现 在 计算 机 
屏幕 上 的 内 容 。 

图 4-9a 给 出 的 网 页 头 只 包含 了 该 文档 的 标题 (在 两 个 “title” 标 签 之 间 )。 该 标题 只 是 用 于 
文档 编制 目的 ， 并 不 会 显示 在 计算 机 屏幕 上 。 要 显示 在 屏幕 上 的 内 容 包 含 在 该 文档 的 体内 。 

图 4-9a 所 示 的 文档 体 的 第 一 个 条 目 是 一 个 包含 文本 “My Web Page” 的 一 级 标题 (在 <h1> 
和 </h1> 标 签 之 间 )。 一 级 标题 意味 着 浏览 器 要 将 该 文本 明显 地 呈现 在 屏幕 上 。 文 档 体 的 下 一 个 
条 目 是 一 个 包含 文本 “Click here for another page.” 的 文本 段落 (在 <p> 和 </p> 标 签 之 间 )。 图 4-9b 
给 出 的 是 浏览 器 显示 在 计算 机 屏幕 上 的 页 面 。 

图 4-9 所 示 的 这 个 页 面 现 在 的 形式 是 没有 实际 意义 的 ， 因 为 当 用 户 单 击 单词 pere 时 ， 什 么 也 
不 会 发 生 ， 虽 然 页 面 上 暗示 了 如 此 操作 会 使 得 浏览 器 显示 另外 一 个 页 面 。 为 了 引发 相关 的 动作 ， 
我 们 必须 将 单词 pere 链 接 到 另 一 个 文档 上 。 
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指示 文档 开 一 <html> 


始 的 标签 Cea 
预备 信息 <title>demonstration page</title> 


</head> 
<body> 
浏览 器 要 显示 <hl>My Web Page</h1> 
的 文档 部 分 <p>Click here for another page.</p> 
</body> a 
指示 文档 结 一 </html> 
束 的 标签 


(a) 用 HTML 编码 的 页 面 


My Web Page 


Click here for another page. 





(b) 显示 在 计算 机 屏幕 上 的 页 面 
图 4-9 一 个 简单 的 网 页 


假设 单 击 单词 here 时 ， 我 们 打算 让 浏览 器 检索 并 显示 URL 为 http://crafty.com/demo. 
html 的 页 面 。 为 此 ， 我 们 必须 先 用 锚 标 签 <a> 和 </a> 在 该 网 页 源 版 本 中 将 单词 here 括 住 。 在 开 
锚 标 签 (opening anchortag) 里 ， 我 们 要 插入 参数 


href = http://crafty.com/demo.html 


(如 图 4-10a 所 示 ) 表 示 与 该 标签 相关 的 超 文 本 引用 (href) 是 跟 在 等 号 后 面 的 URL (http://crafty. 
com/demo.html)。 加 上 销 标 签 后 ， 网 页 将 会 像 图 4-10b 所 示 的 那样 呈现 在 计算 机 屏幕 上 。 注 
意 ， 它 与 图 4-9b 是 一 样 的 ， 只 是 单词 here 用 彩色 突出 显示 了 ， 表 示 它 是 到 男 一 个 网 页 的 链接 。 
单 击 这 类 突出 显示 的 词 会 使 得 浏览 器 检索 并 显示 相关 的 网 页 。 因 此 ， 网 页 是 通过 锚 标 签 链接 
到 彼此 的 。 

最 后 ， 我 们 来 说 明 一 下 ， 如 何 将 图 像 加 入 到 我 们 这 个 简单 的 网 页 里 来 。 为 此 ， 假 设 要 插入 
的 图 像 的 了 了 EG 编 码 是 存储 在 Images . com 的 Images 目 录 中 的 文件 ourPic.jpg， 且 对 那 一 位 置 的 
万 维 网 服务 器 可 用 。 在 这 些 条 件 下 ， 我 们 可 以 通过 在 HTML 源 文档 的 <body> 标 签 后 插入 图 像 标 签 
<img src="http://Images.com/Images/OurPic.jpg">， 告 诉 浏览 器 在 该 网 页 的 顶部 显示 
该 图 像 。 这 告诉 浏览 器 的 是 名 为 0urPic.jpg 的 图 像 应 该 显示 在 该 文档 的 开头 。(src 是 “source” 
的 简写 ， 意 思 是 等 号 后 面 的 信息 表示 的 是 要 显示 的 图 像 的 来 源 。) 浏览 器 发 现 这 个 标签 时 ， 就 会 给 
位 于 Images .com 的 HTTP 服 务 器 发 送 一 条 报 文 , 请 求 OurPic.jpg 图 像 , 然后 恰当 地 显示 该 图 像 。 

如 果 我 们 将 该 图 像 标 签 移 到 文档 的 后 面 ， 恰 好 放 在 </body> 标 签 的 前 面 ， 那 么 该 浏览 器 就 
会 在 该 网 页 的 底部 显示 该 图 像 。 当 然 ， 在 网 页 上 定位 图 像 还 有 许多 更 复杂 的 技巧 ， 但 是 现在 我 
们 不 必 关 心 这 些 问题 。 
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含有 参数 
| 


闭 错 标签 一 导 





(a) 用 HTML 编 码 的 页 面 


My Web Page 


Click here for another page. 





(b) 显示 在 计算 机 屏幕 上 的 页 面 
图 4-10 一 个 增强 的 简单 网 页 


4.3.3 XML 


HTML 本 质 上 是 一 个 符号 系统 ， 文 本 文档 及 其 外 观 都 可 以 通过 它 编码 成 一 个 简单 的 文本 文 
件 。 同 理 ， 我 们 也 可 以 将 非 文本 内 容 编码 成 文本 文件 ， 如 乐谱 。 乍 一 看 ， 传 统 上 表示 音乐 的 “五 
线 谱 、 小 节 线 和 音符 ”模式 并 不 符合 文本 文件 规定 的 一 个 字符 接着 一 个 字符 的 格式 。 不 过 ， 我 
们 可 以 通过 开发 另外 一 种 符号 系统 来 克服 这 个 问题 。 更 准确 地 说 , 我 们 可 以 规定 用 <staff clef 
= "treble"> 表 示 五 线 谱 的 开始 ， 用 </staff> 表 示 五 线 谱 的 结束 ， 用 <time> 2/4 </time> 
这 个 形式 表示 拍 号 ， 用 <measure> 和 </measure> 分 别 表 示 小 节 的 开始 和 结束 ， 用 <notes> 
egth C </notes> 表 示 八 分 音符 C， 等 等 。 那 么 ， 文 本 

<staff clef = "treble"> <key>C minor</key> 

<time> 2/4 </time> 

<measure> <rest> egth </rest> <notes> egth G， 

egth G, egth G </notes></measure> 

<measure> <notes> hlf E </notes></measure> 

</staff> 


就 可 以 用 于 编码 图 4-11 所 示 的 音乐 。 使 用 这 种 符号 ， 乐 谱 就 可 以 作为 文本 文件 编码 、 修 改 、 存 
储 和 在 因特网 上 传送 。 此 外 ,还 可 以 编写 软件 ， 将 这 类 文件 的 内 容 以 传统 乐谱 的 形式 表现 出 来 ， 
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甚至 可 以 用 一 个 音乐 合成 器 来 演奏 这 个 音乐 。 
注意 ， 我 们 的 乐谱 编码 系统 沿用 了 HTML 

使 用 的 风格 。 对 于 标识 组 成 部 分 的 标签 ， 我 们 

选择 了 符号 “<” 和 “>” 来 划 定 标签 。 我 们 选 

择 用 相同 的 标签 名 表示 结构 (如 五 线 谱 、 音 符 图 4-11 贝多 芬 第 五 交响 曲 的 前 两 小 节 

串 ， 或 者 小 节 ) 的 开始 和 结束 ， 结 束 标 签 由 一 

条 和 斜 线 指定 〈 以 <measure> 开 始 的 就 以 </measure> 结 束 )。 我 们 选择 用 诸如 clef= "treble" 

这 样 的 表达 式 来 指示 标签 中 的 特殊 属性 。 这 种 风格 还 可 以 用 于 开发 表示 其 他 格式 〈 如 数学 表达 

式 和 图 形 ) 的 系统 。 

可 扩展 标记 语言 (eXtensible Markup Language，XML ) 是 一 种 标准 化 的 风格 (类 似 于 上 面 
乐谱 的 例子 )， 用 于 设计 将 数据 表示 为 文本 文件 的 符号 系统 。 事 实 上 ，XML 是 从 一 套 比较 老 的 
称 为 标准 通用 标记 语言 (Standard Generalized Markup Language，SGML) 的 标准 中 派生 出 来 的 
简化 上 版。 遵照 XML 标准 ， 大 们 已 经 开发 出 了 一 批 称 为 标记 语言 (markup language) 的 符号 系统 ， 
可 以 表示 数学 、 多 媒体 演示 以 及 音乐 。 事 实 上 ，HTML 就 是 一 种 基于 XML 标准 开发 的 用 于 表示 
网 页 的 标记 语言 。( 实 际 上 ，HTML 的 原始 版 本 在 XML 标准 巩固 之 前 就 已 经 开发 出 来 了 ， 因 此 
HTML 的 一 些 特征 不 严格 遵守 XML。 正 是 这 个 原因 ， 我 们 可 能 需要 参考 XHTML， 它 是 严格 遵 
守 XML 的 HTML 版 本 。) 

关于 如 何 设 计 标 准 以 获得 广泛 应 用 ，XML 是 个 很 好 的 范例 。 为 了 编码 各 种 类 型 的 文档 ， 我 
们 不 应 设计 单独 的 、 无 关联 的 各 种 标记 语言 ， XML 所 表示 的 方法 就 是 要 开发 一 种 通用 标记 语言 
标准 ， 通 过 这 个 标准 ， 就 可 以 为 各 种 应 用 开发 不 同 的 标记 语言 。 这 样 开 发 出 来 的 标记 语言 具有 
一 致 性 ， 可 以 组 合 起 来 获得 复杂 应 用 的 标记 语言 ， 如 包含 乐谱 片段 和 数学 表达 式 的 文本 文档 。 

最 后 ， 要 说 明 的 是 ，XML 人 允许 开发 与 HTML 不 同 的 新 的 标记 语言 ， 因 为 新 的 标记 语言 强调 
的 是 语义 而 不 是 词 本 身 。 例 如 ， 使 用 HTML 可 以 标记 菜谱 里 的 配料 ， 使 得 它们 以 列表 形式 出 现 ， 
每 一 种 配料 单独 占 一 行 。 不 过 ， 如 果 我 们 使 用 面向 语义 的 标签 ， 荣 谱 里 的 配料 就 可 以 标记 为 配 
料 〈 也 许 是 用 标签 <ingredient> 和 </ingredient>) 而 不 仅仅 是 列表 中 的 各 个 项 。 这 个 区 别 很 
细微 但 是 很 重要 。 语义 方法 使 得 搜索 引擎 (search engine， 协 助 用 户 定 位 与 关注 主题 相关 的 网 页 信 
息 的 网 站 ) 能 够 确定 哪些 菜谱 包含 或 者 不 包含 某 些 配料 ， 这 将 是 现在 搜索 引擎 技术 的 一 项 重大 改 
进 ， 因 为 现在 的 技术 只 能 够 分 离 出 含有 或 者 不 含有 某 些 单词 的 菜谱 。 更 准确 地 说 ， 如 果 使 用 语义 
标签 ， 搜 索引 擎 就 可 以 找到 不 包含 菠菜 的 卤 汁 宽 面 的 菜谱 ， 而 只 根据 单词 内 容 进 行 的 类 似 搜索 就 
会 跳 过 以 “这 个 商 汁 宽 面 不 包含 菠菜 ”开始 的 菜谱 。 同 样 ， 如 果 根 据 语 义 而 不 是 词 本 身 使 用 因 特 
网 范围 的 标准 来 标记 文档 ， 那 么 创建 的 是 万 维 “ 语 义 ” 网 ， 而 不 是 现在 使 用 的 万 维 “ 语 法 ”网 。 


4.3.4 客户 端 和 服务 器 端的 活动 


现在 我 们 来 考虑 一 下 ， 检 索 图 4-10 所 示 的 简单 网 页 ， 并 将 其 显示 在 浏览 器 所 在 的 计算 机 屏 
幕 上 ， 都 需要 哪些 步骤 。 首 先 ， 扮 演 客户 端 角色 的 浏览 器 要 使 用 URL (也 许 是 从 使 用 该 浏览 器 
的 人 那里 获得 ) 里 的 信息 ， 与 控制 对 该 网 页 访问 的 万 维 网 服务 器 建立 联系 ， 然 后 请 求 它 传送 该 
页 面 的 一 个 副本 。 服 务 器 然后 要 将 图 4-10a 上 显示 的 文本 文档 发 送 给 浏览 器 作为 响应 。 接 着 ， 浏 
览 器 将 解释 该 文档 中 的 HTML 标 签 ， 以 确定 如 何 显示 该 页 面 ， 并 将 文档 呈现 在 计算 机 屏幕 上 。 
浏览 器 的 用 户 就 将 看 到 如 图 4-10b 所 示 的 图 像 。 如 果 用 户 接着 用 鼠标 单 击 单词 pere， 浏 览 器 将 使 
用 相关 联 的 锚 标 签 中 的 URL 联 系 到 那个 相应 的 服务 器 ， 获 得 并 显示 另 一 个 网 页 。 总 之 ， 整 个 过 
程 就 是 浏览 器 按照 用 户 的 要 求 获取 并 显示 网 页 。 

但 是 ， 如 果 我 们 想 获得 一 个 带 有 动画 的 网 页 ， 或 者 是 一 个 允许 客户 填写 订单 并 提交 的 网 页 
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呢 ? 这 些 需求 就 需要 浏览 器 或 万 维 网 服务 器 付出 额外 的 行动 。 如 果 这 些 行动 由 客户 机 〈 如 浏览 
器 ) 完成 则 称 为 客户 端 (client-side ) 活动 ， 如 果 由 服务 器 (如 万 维 网 服务 器 〉 完 成 则 称 为 服务 
器 端 (server-side ) 活动 。 

举 个 例子 ， 假 设 旅行 代理 商 想 要 客户 能 确认 想 去 的 目的 地 和 旅行 日 期 ， 它 将 呈现 给 客户 一 
个 定制 的 网 页 ， 只 包含 与 该 客户 需求 有 关 的 信息 。 在 这 种 情况 下 ， 旅 行 代理 商 的 网 站 将 首先 呈 
现 给 客户 一 个 包含 可 供 选 择 的 旅游 目的 地 的 网 页 。 客 户 根 据 这 个 信息 ， 指 定 感 兴趣 的 目的 地 和 
旅行 日 期 (客户 端 活动 )。 然 后 这 些 信息 将 传 回 给 旅行 代理 商 的 服务 器 ， 服 务 器 利用 这 些 信息 
来 构建 合适 的 定制 网 页 〈 服 务 器 端 活动 )， 再 将 这 个 网 页 发 送 给 客户 的 浏览 器 。 

再 举 一 个 使 用 搜索 引擎 服务 的 例子 。 在 这 种 情况 下 ， 客 户 机 的 用 户 指 定 感 兴趣 的 主题 (客户 
端 活动 )， 然 后 这 个 主题 被 传送 给 搜索 引擎 ， 搜 索引 擎 会 构建 一 个 包含 用 户 可 能 感 兴趣 文档 的 定 
制 网 页 〈 服 务 器 端 活动 )， 然 后 发 回 给 客户 机 。 还 有 一 个 例子 就 是 万 维 网 邮件 (Web mail) 一 一 日 
益 流行 的 一 种 方法 ， 通 过 它 计 算 机 用 户 能 通过 万 维 网 浏览 器 来 访问 他 们 的 电子 邮件 。 在 这 种 情况 
下 ， 万维网 服务 器 是 客户 机 与 客户 机 邮件 服务 器 之 间 的 中 间 层 。 从 本 质 上 讲 ， 万 维 网 服务 器 构建 
包含 邮件 服务 器 信息 的 网 页 〈 服 务 器 端 活动 )， 把 这 些 网 页 发 送 给 客户 机 ， 由 客户 机 浏览 器 显示 
它们 (客户 端 活动 ，。 相 反 ， 浏 览 器 支持 用 户 创建 消息 (客户 端 活 动 )， 并 把 这 一 信息 发 送 给 万 维 
网 服务 器 ， 万 维 网 服务 器 再 把 这 些 消息 转发 给 邮件 服务 器 (服务 器 端 活动 ) 进行 邮寄 。 

实现 客户 端 和 服务 器 端 活动 的 系统 有 很 多 ， 可 谓 争 奇 斗 艳 ， 各 有 千秋 。 一 种 早期 的 控制 客 
户 端 活动 的 方法 现在 仍然 很 流行 , 这 种 方法 是 在 网 页 的 HTML 源 文档 中 包含 用 JavaScript 语 言 ( 由 
Netscape Communications 公 司 开发 ) 编写 的 程序 。 浏 览 器 可 以 从 中 获取 程序 并 根据 需要 执行 。 
另外 一 种 〈 由 Sun Microsystems 公 司 开发 的 ) 方法 是 ， 首 先 将 一 个 网 页 传送 给 浏览 器 ， 然 后 将 称 
为 小 应 用 程序 (applet， 用 Java 语 言 编写 的 ) 的 额外 程序 单元 根据 HTML 源 文档 的 请 求 传送 给 该 
浏览 器 。 还 有 一 种 方法 是 使 用 Flash (由 Macromedia 公 司 开发 )， 通 过 它 可 以 实现 大 量 多 媒体 客 
户 端 演示 。 

控制 服务 器 端 活 动 的 一 个 早期 方法 是 ， 使 用 一 组 称 为 公共 网 关 接 口 (Common Gateway 
Interface，CGI) 的 标准 ， 客 户 通过 它 可 以 请 求 执行 存储 在 服务 器 中 的 程序 。 这 种 方法 的 一 个 
变 体 ( 由 Sun Microsystems 公 司 开 发 ) 是 允许 客户 机 在 服务 器 端 执行 称 为 小 服务 程序 (servlet) 
的 程序 单元 。 如 果 所 请 求 的 服务 器 端 活动 是 构造 一 个 定制 的 网 页 ， 如 前 面 旅行 代理 商 的 例子 ， 
那么 就 可 以 使 用 小 服务 程序 方法 的 一 种 简化 版 本 。 在 这 种 情况 下 ， 称 为 Java 服 务 器 页 面 〈Java 
Server Page，JSP) 的 网 页 模板 存储 在 万 维 网 服务 器 里 ， 它 利用 从 客户 机 接收 到 的 信息 来 完成 
该 网 页 。 微 软 公司 采用 了 一 种 类 似 的 构造 定制 网 页 模板 的 方法 ， 称 为 活动 服务 器 页 面 (Active 
Server Page，ASP)。 与 这 些 专 有 系统 相对 ，PHP 是 一 种 实现 服务 器 端 功能 的 开源 系统 。PHP 
最 初代 表 个 人 主页 (Personal Home Page)， 现 在 指 的 是 PHP 超 文本 处 理 程序 (PHP Hypertext 
Processor )。 

最 后 ， 我 们 应 清醒 地 认识 到 ， 由 于 允许 客户 机 和 服务 器 在 对 方 的 机 器 上 执行 程序 ， 会 引发 
一 些 安全 性 问题 和 道德 问题 。 万 维 网 服务 器 会 例行公事 地 给 客户 机 传送 要 执行 的 程序 ， 这 个 事 
实 给 服务 器 端 带 来 了 道德 问题 ， 并 相应 地 给 客户 端 带 来 了 安全 性 问题 。 如 果 客 户 机 言 目地 执行 
万 维 网 服务 器 发 送 来 的 任何 程序 ， 它 就 为 服务 器 的 恶意 活动 打开 了 大 门 。 同 理 ， 客 户 机 可 以 让 
程序 在 服务 器 执行 ， 因 此 也 给 客户 端 带 来 了 道德 问题 ， 相 应 地 给 服务 器 端 带 来 了 安全 性 问题 。 
如 果 服 务 器 端 盲目 地 执行 客户 机 发 送 过 来 的 任何 程序 ， 那 么 可 能 会 导致 服务 器 产生 安全 漏洞 和 
潜在 的 损害 。 


@ 已 被 Adobe 公 司 收购 。 
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问题 与 练习 

1. 什么 是 URL? 什么 是 浏览 器 ? 

2. 什么 是 标记 语言 ? 

3. HTML 和 XML 的 区 别 是 什么 ? 

4. 下 列 每 个 HTML 标 签 的 目的 是 什么 ? 
a.<html> b.<head> c.</p> d.</a> 


5. 客户 端 和 服务 器 端 分 别 指 什么 ? 


aii tim 





ON ei ee HE ee TE EE ee eT 


*4.4 ”因特网 协议 


本 节 研 究 报 文 是 如 何在 因特网 上 传送 的 。 因 为 传送 过 程 需要 系统 中 所 有 计算 机 的 合作 ， 所 
以 控制 传送 过 程 的 软件 需要 驻 留 在 因特网 的 每 台 计算 机 中 。 我 们 首先 研究 此 类 软件 的 总 体 结 构 。 


4.4.1 因特网 软件 的 分 层 方法 


网 络 软件 的 首要 任务 是 提供 从 一 台 机 器 到 另 一 台 机 器 传送 报 文 所 需 的 基础 设施 。 在 因特网 
上 ， 报 文 传递 活动 是 通过 软件 单元 的 层次 结构 完成 的 ， 这 和 你 把 一 份 礼物 从 美国 的 西海 岸 邮 寄 
给 东海 岸 的 一 个 朋友 的 任务 类 似 ( 见 图 4-12)。 首先 , 把 礼物 打包 并 在 包 衷 外面 写 上 正确 的 地 址 ; 
接着 ， 把 包 奢 拿 到 运输 公司 ， 如 美国 邮局 运输 公司 把 这 个 包 里 和 其 他 包 裴 一 同 放 入 一 个 大 的 
集装箱 ， 送 往 与 其 签 有 服务 合同 的 航空 公司 ; 航空 公司 将 集装箱 装 入 飞机 并 运往 目的 城市 ， 也 
许 沿途 还 要 经 过 中 间 站 ; 到 达 目 的 地 ， 航 空 公司 把 集装箱 从 飞机 上 逢 下 ， 然 后 送 往 当 地 的 运输 
公司 ; 接着 ,运输 公司 把 你 的 包 里 从 集装箱 里 取出 送 给 收 件 人 。 


pT ET 








源 目的 地 

准备 运送 几 F- ”| 收 到 并 打 

的 包 守 | 您 -< 朋友 并 于 
把 包裹 放 入 集 装 ”| 从 集装箱 取出 包 
箱 以 便 交 给 航空 | 运输 全 运输 公司 ，， 驯 送 给 收 件 人 





公司 TD 





sh se, “用 


将 集装箱 放 | 
到 飞机 上 “| 航空 公 司 





将 集装箱 转移 到 另 一 架 飞 机 


图 4-12” 包 于 运输 的 例子 
简 而 言 之 ， 礼 物 的 运输 过 程 需 要 3 个 层级 : (1) 用 户 级 (包括 你 和 你 的 朋友 ); (2) 运输 公 
司 ; (3) 航空 公司 。 每 一 级 都 把 下 一 级 当 作 抽象 工具 来 使 用 。( 你 不 关心 运输 公司 的 工作 细节 ， 
而 运输 公司 也 不 关心 航空 公司 的 内 部 运作 。) 层次 的 每 一 级 在 源 端 和 目的 端 都 有 代理 , 在 目的 端 
的 代理 完成 在 源 端 相 应 代理 的 相反 工作 。 
因特网 上 软件 控制 通信 的 过 程 和 运输 包 囊 的 情况 类 似 , 但 因特网 上 的 软件 有 4 层 而 不 是 3 层 ， 
每 层 所 涉及 的 是 软件 例 程 而 不 是 人 和 企业 。 这 4 层 被 称 为 应 用 层 (application layer)、 传 输 层 
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(transport layer)、 网 络 层 (network layer)、 链 路 层 (link layer)( 见 图 4-13)。 通 常 ， 由 应 用 层 产 
生 一 个 报 文 ， 当 这 个 报 文 准备 传输 时 ， 从 应 用 层 向 下 传递 ， 经 由 传输 层 和 网 络 层 ， 最 后 传递 到 
链 路 层 进 行 传输 。 目 的 地 的 链 路 层 接收 这 条 报 文 ， 沿 道 向 分 层 结构 向 上 传递 ， 直 到 把 它 交 给 报 
文 目的 地 的 应 用 层 。 


下 面 通过 跟踪 一 个 报 文通 过 网 络 系统 的 路 径 ， 从 总 体 上 研究 一 下 应 用 层 
报 文 的 传输 过 程 ( 见 图 4-14)。 首 先 从 应 用 层 开始 。 | 
应 用 层 由 那些 使 用 因特网 通信 来 完成 任务 的 软件 单元 组 成 ， 如 客 
户 机 和 服务 器 。 虽 然 名 称 类 似 ， 但 是 这 一 层 不 局 限于 3.2 节 介绍 的 软件 传输 层 
分 类 中 的 应 用 软件 ， 还 包括 许多 实用 软件 包 。 例 如 ， 使 用 FTP 传 送 文 
件 的 软件 和 利用 SSH 提 供 远程 登录 功能 的 软件 已 经 很 普遍 ， 所 以 它们 
通常 被 认为 是 实用 软件 。 网 络 层 
应 用 层 使 用 传输 层 在 因特网 上 发 送 和 接收 报 文 ， 这 与 我 们 通过 运 | 
输 公司 邮寄 和 接收 包 奢 非常 相似 。 正 像 我 们 有 责任 提供 一 个 和 运输 公 
司 所 要 求 的 规范 一 致 的 地 址 一 样 ， 应 用 层 负责 向 因特网 基础 设施 提供 链 路 层 


兼容 的 地 址 。 为 了 满足 这 个 要 求 ， 应 用 层 利用 因特网 上 的 域名 服务 器 

提供 的 服务 把 人 类 使 用 的 助 记 地 址 翻译 成 符合 因特网 规范 的 人 P 地 址 。 ”图 4-13 因特网 软件 层次 
传输 层 的 重要 任务 是 从 应 用 层 接收 报 文 并 确保 报 文 以 正确 的 格式 在 因特网 上 传输 。 为 了 后 

一 个 目标 ， 传 输 层 将 长 报 文 分 成 小 的 片段 作为 独立 单位 在 因特网 上 传输 。 这 种 分 段 是 必需 的 ， 

因为 一 个 长 报 文 会 阻塞 许多 其 他 从 因特网 路 由 器 上 经 过 的 报 文 流 。 实 际 上 ， 小 段 的 报 文 可 以 在 

这 些 节点 交叉 通过 ， 而 一 个 长 报 文 在 经 过 这 些 节点 时 将 迫使 其 他 报 文 等 待 ( 很 像 在 铁路 交叉 道 

口 ， 许 多 小 汽车 等 一 列 长 火车 通过 的 情况 )。 


在 每 个 中 转 站 ， 网 络 层 
确定 分 组 转发 的 方向 





v 3 加 Tr A 下 王 , 滑 ee . et 
二 目的 起 是 加 | 志 用 扣 应 用 层 “| 接收 报 文 、 
把 报 文 分 成 | | 
| 
为 每 个 分组 人 ee i 。 检测 分 组 是 否 到 
女 本 = 外 而 因 | 网络 层 网 络 层 、 目 蛋 “网 络 屋 “加 全 “由 结 司 ww 
这 | | | 
传送 分 组 。 | 。 链 路 层 由 链 路 层 【月 链 路 层 下 司 链 路 琶 ， | 粮 收 分 组 

源 中 转 站 最 终 目的 地 


图 4-14 ”因特网 上 报 文 的 传送 过 程 
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传输 层 在 生成 的 小 片段 上 增加 序列 号 ， 从 而 使 这 些 片段 在 报 文 的 目的 地 可 以 重组 ， 然 后 将 
这 些 称 为 分 组 〈packet) 的 片段 交 给 网 络 层 。 从 这 一 刻 开 始 ， 这 些 分 组 被 认为 是 彼此 独立 而 无 
关 的 报 文 ， 直 到 它们 到 达 最 终 目的 地 的 传输 层 。 这 些 属于 同一 个 长 报 文 的 分 组 很 有 可 能 沿 着 不 
同 的 路 径 在 因特网 中 传输 。 

在 因特网 的 传输 路 径 的 每 个 步骤 上 决定 分 组 的 下 一 个 发 送 方向 ， 这 是 网 络 层 的 任务 。 事 实 
上 ， 网 络 层 和 其 下 层 的 链 路 层 的 组 合 构成 了 驻 留 在 因特网 路 由 器 上 的 软件 。 网 络 层 负责 维护 路 
由 器 的 转发 表 ， 并 使 用 此 表决 定 分 组 的 转发 方向 。 路 由 器 中 的 链 路 层 负 责 接收 和 传输 分 组 。 

这 样 ， 当 分 组 发 源 地 的 网 络 层 接收 来 自传 输 层 的 分 组 时 ， 它 会 使 用 其 转发 表 来 确定 分 组 应 
该 被 发 送 到 哪里 ， 并 在 那里 开始 分 组 的 旅程 。 决 定好 合适 的 方向 后 ， 网 络 层 把 分 组 交 给 链 路 层 ， 
进行 实际 传输 。 

链 路 层 具 有 传送 分 组 的 职责 ， 因 此 ， 它 必须 要 处 理 目的 计算 机 所 在 的 个 体 网 络 的 特有 的 通 
信 细 节 。 例 如 ， 如 果 网 络 是 以 太 网 ， 链 路 层 将 使 用 CSMA/CD 协 议 ; 如 果 网 络 是 WiFi 网 ， 链 路 层 
将 使 用 CSMA/CA 协 议 。 

当 分 组 被 发 送 后 ， 连 接 另 一 端的 链 路 层 会 接收 它 。 在 那里 ， 链 路 层 把 分 组 向 上 交 给 网 络 层 ， 
由 网 络 层 把 分 组 的 最 终 目 的 地 和 网 络 层 的 转发 表 进行 比 对 ， 确 定 分 组 下 一 步 的 方向 。 当 作出 这 
个 决定 后 ， 网 络 层 把 分 组 返回 给 链 路 层 ， 分 组 沿 着 它 的 路 径 被 转发 。 使 用 这 样 的 方式 ， 每 个 分 
组 从 一 台 机 器 跳 到 另 一 台 机 器 ， 最 终 到 达 它 的 目的 地 。 

需要 注意 的 是 ， 在 这 个 旅程 中 ， 只 涉及 中 间 站 的 链 路 层 和 网 络 层 〈 再 次 参见 图 4-14)， 因 此 
正如 前 面 提 及 的 ， 只 有 这 两 个 层 存 在 于 路 由 器 上 。 此 外 ， 为 了 尽量 减少 在 每 个 中 间 “ 站 ”上 的 
延迟 时 间 ， 路 由 器 中 的 网 络 层 转 发 角色 是 紧密 地 与 链 路 层 集 成 在 一 起 的 。 因 此 ， 现 代 路 由 器 转 
发 一 个 分 组 所 需 的 时 间 是 用 百 万 分 之 一 秒 来 衡量 的 。 

在 分 组 的 最 终 目 的 地 ， 由 网 络 层 来 确认 分 组 的 旅程 已 经 完成 。 在 这 种 情况 下 ， 网 络 层 会 
分 组 交 给 它 的 传输 层 ， 而 不 再 转发 它 。 传 输 层 从 网 络 层 接 收 这 个 分 组 时 ， 会 提取 组 成 报 文 的 基 
本 片段 ， 按 照 报 文 源 端 传输 层 所 提供 的 片段 序列 号 重组 原始 的 报 文 。 一 旦 报 文 重 组 ， 传 输 层 就 
把 它 交 给 应 用 层 的 适当 单元 一 一 这 样 便 完成 了 报 文 的 传输 过 程 。 

确定 应 用 层 内 哪个 单元 来 接收 到 来 的 报 文 是 传输 层 的 一 个 重要 任务 ， 这 个 任务 由 为 各 个 单 
元 分 配 唯一 的 端口 号 (port number， 它 与 第 2 章 讨论 的 IO 端口 无 关 ) 来 控制 ， 传 输 层 要 在 报 文 
开始 传输 旅程 之 前 ， 把 适当 的 端口 号 附加 到 报 文 地 址 上 。 然后 , 一 旦 目的 地 的 传输 层 收 到 报 文 ， 
它 只 需 将 报 文 交 给 指定 端口 号 上 的 应 用 层 软 件 。 

因特网 用 户 很 少 需要 关心 端口 号 ， 因 为 常见 的 应 用 有 普遍 公认 的 端口 号 。 例 如 ， 如 果 请 求 
万 维 网 浏览 器 检索 URL 为 http://www.zoo.org/animals/frog.html 的 文档 , 那么 浏览 器 认 
为 应 该 通过 80 端 口 和 www.zoo.ozg 的 HTTP 服 务 器 联系 。 同 样 ， 当 发 送 邮件 时 ，SMTP 客 户 机 认 
为 应 当 通 过 25 端 口 与 SMTP 邮 件 服务 器 通信 。 

概括 地 说 ， 因 特 网 上 的 通信 涉及 4 层 软件 的 相互 作用 。 应 用 层 以 应 用 的 观点 处 理 报 文 ; 传输 
层 把 报 文 转换 成 适合 因特网 的 段 ， 并 负责 将 接收 到 的 报 文 重组 好 后 交 给 适当 的 应 用 程序 ; 网络 
层 处 理 段 通 过 因特网 的 方向 ， 链 路 层 处 理 段 从 一 台 机 器 到 另 一 台 机 器 的 实际 传输 。 令 人 惊讶 的 
是 ， 虽 然 有 这 么 多 的 工作 ， 因 特 网 的 响应 时 间 却 是 以 毫秒 记 的 ， 所 以 许多 事务 是 瞬间 完成 的 。 


4.4.2 TCP/IP 协 议 簇 


由 于 需要 开放 式 网 络 ， 所 以 需要 颁布 一 些 标准 ， 通 过 这 些 标准 ， 不 同 制造 商 生 产 的 设备 和 
软件 才能 和 其 他 厂商 的 产品 一 起 正常 运行 。 其 中 己 产 生 的 一 个 标准 是 ， 由 国际 标准 化 组 织 制 定 
的 开放 系统 互 连 (Open System Interconnection，OSI) 参考 模型 。 与 我 们 刚刚 描述 的 4 层 结构 不 
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同 ，OSI 标 准 是 以 7 层 结构 为 基础 的 。 它 带 有 国际 组 织 的 权威 性 ， 所 以 它 经 常 被 引用 ， 但 是 它 述 
迟 未 能 取代 4 层 结 构 的 观点 ， 这 主要 是 因为 4 层 结构 在 OSI 模 型 制定 之 前 已 经 成 为 因特网 的 事实 
标准 。 

TCP/IP 协 议 簇 是 因特网 所 使 用 的 协议 标准 的 集合 ， 是 用 来 实现 4 层 通 信 层 次 结构 的 。 实 际 上 ， 
传输 控制 协议 ‘Transmission Control Protocol，TCP) 和 网 际 协议 (Internet Protocol，IP) 只 是 
这 个 庞大 集合 中 两 个 协议 的 名 字 一 一 因此 把 整个 协议 集合 称 为 TCP/IP 协 议 簇 容易 产生 误解 。 更 
确切 地 说 ，TCP 定 义 了 传输 层 的 一 个 版 本 ， 这 里 说 版 本 是 因为 TCP/IP 协 议 簇 不 只 提供 一 种 传输 
层 实现 方式 ， 例 如 ， 还 可 用 用 户 数 据 报 协 议 (User Datagram Protocol，UDP) 定义 其 他 版 本 的 
传输 层 。 传 输 层 具有 多 种 版 本 的 情况 和 运输 包 囊 的 情况 类 似 ， 你 可 以 选择 不 同 的 运输 公司 ， 每 
家 公司 提供 相同 的 基本 服务 ， 但 又 各 有 所 长 。 因 此 ， 根 据 对 特定 的 服务 质量 的 要 求 ， 应 用 层 的 
软件 单元 可 以 选择 是 通过 传输 层 的 TCP 版 本 来 发 送 数据 ， 还 是 通过 传输 层 的 UDP 版 本 来 发 送 数 
据 《〈 见 图 4-15 )。 应 用 层 

TCP 和 UDP 之 间 有 一 些 区 别 。 第 一 个 区 别 是 ， 在 发 送 应 
用 层 所 请 求 的 报 文 前 ， 基 于 TCP 协 议 的 传输 层 要 问 目的 地 的 





传输 层 发 送 它 自 己 的 报 文 ， 告 诉 目的 地 传输 层 有 报 文 要 发 有 上 

送 ， 然 后 ， 它 要 等 待 目 的 地 确认 这 个 报 文 后 才 开 始 发 送 应 用 传输 层 _/ NN 

层 报 文 。 采 用 这 种 方式 时 ， 据 说 基于 TCP 的 传输 层 在 发 送 报 TCP | UDP 

文 前 要 建立 一 个 连接 。 而 基于 UDP 的 传输 层 在 发 送 报 文 前 不 比较 “可靠” 但 | “比较 高 效 但 
需要 建立 这 样 的 连接 ， 它 仅仅 按照 所 给 的 地 址 发 送 报 文 ， 然 i 
后 就 忘记 这 个 报 文 ， 尽管 它 知 道 ， 目 的 地 的 计算 机 可 能 根本 图 4-15 ”在 TCP 和 UDP 之 间 选 择 


没 运作 。 由 于 这 个 原因 ，UDP 被 称 为 无 连接 协议 。 

TCP 和 UDP 之 间 的 第 二 个 区 别 是 ， 源 和 目的 地 的 TCP 传 输 层 通过 确认 和 分 组 重 发 的 方式 共 
同 确保 一 个 报 文 的 所 有 片段 都 被 成 功 地 传输 到 目的 地 。 因 此 ，TCP 被 称 为 可 靠 的 协议 ， 而 UDP 
不 提供 这 种 重 发 服务 ， 被 称 为 不 可 靠 的 协议 。 

TCP 和 UDP 之 间 还 有 另外 一 个 区 别 ， 那 就 是 TCP 提 供 了 流量 控制 (flow control) 和 拥塞 控制 
(congestion control)， 前 者 是 指 报 文 源 点 的 TCP 传 输 层 能 降低 它 发 送 数据 段 的 速率 ， 防 止 目 的 地 
的 对 应 方 应 接 不 上 暇 ， 后 者 是 指 报 文 源 点 的 TCP 传 输 层 能 调整 它 的 发 送 速 率 ， 减 轻 它 与 报 文 目的 
地 间 的 拥塞 。 

所 有 这 些 并 不 意味 着 UDP 是 一 个 不 好 的 协议 ， 要 知道 基于 UDP 的 传输 层 比 基 于 TCP 的 更 精 
简 ， 因 此 ， 如 果 一 个 应 用 有 能 力 处 理 UDP 的 潜在 影响 ,那么 基于 UDP 的 传输 层 会 是 更 好 的 选择 。 
例如 ，UDP 的 高 效 使 得 它 成 为 DNS 查找 和 VoIP 选择 的 协议 。 但 是 ， 因 为 电子 邮件 在 时 间 上 不 太 
敏感 ， 所 以 邮件 服务 器 使 用 TCP 传 送 电子 邮件 。 

IP 是 用 于 实现 分 配给 网 络 层 任务 的 因特网 标准 。 我 们 注意 到 这 个 任务 包括 转发 (forwarding， 
这 涉及 通过 因特网 来 中 继 分 组 ) 和 路 由 (routing， 这 涉及 更 新 层 的 转发 表 ， 以 反映 出 条 件 的 改 
变 )。 例如 ,一 个 路 由 器 可 能 会 出 现 故 障 (意味 着 流量 应 该 不 会 再 被 转发 到 它 这 个 方向 上 来 ) 或 
因特网 的 一 个 区 域 可 能 会 变 得 拥塞 (意味 着 流量 应 该 绕 过 这 个 障碍 进行 路 由 )。 当 相 邻 网 络 层 交 
换 路 由 信息 时 ， 有 许多 与 路 由 有 关 的 耳 标 准 可 用 于 处 理 相 邻 网 络 层 间 的 通信 协议 。 

与 转发 有 关 的 一 个 有 趣 的 特性 是 ， 每 次 报 文 源 的 耳 网 络 层 在 准备 一 个 分 组 时 ， 都 会 把 一 个 
称 为 跳 数 (hop count) 或 生存 的 时 间 (time to live) 的 值 附 加 到 那个 分 组 上 。 这 个 值 限制 了 分 组 
在 尝试 找到 通过 因特网 的 出 路 时 应 该 被 转发 的 次 数 。 卫 网 络 层 每 次 转发 一 个 分 组 ， 都 要 把 这 个 
分 组 的 跳 数 减 1。 通 过 这 个 信息 ， 网 络 层 能 保护 因特网 ， 以 免 分 组 在 系统 内 无 休止 地 循环 。 虽 然 
因特网 的 规模 每 天 都 在 增长 , 但 初始 的 64 跳 数 仍然 足以 让 分 组 在 当今 ISP 的 路 由 器 迷宫 中 找到 它 
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自己 的 出 路 。 

多 年 以 来 ， 称 为 IPv4 (IP 版 本 4) 的 IP 版 本 一 直 被 用 于 在 因特网 内 实现 网 络 层 ， 然 而 因特网 
迅速 超出 了 IPv4 所 规定 的 32 位 互联 网 编 址 系统 。 为 了 解决 这 一 问题 并 实现 其 他 改进 (如 多 播 )， 
人 们 建立 了 一 个 称 为 IPv6 的 新 的 了 版 本 ， 它 使 用 的 互联 网 地 址 有 128 位 。 目 前 ，IPv4 到 IPv6 的 转换 
正在 进行 (这 个 转换 在 4.2 节 中 介绍 因特网 地 址 的 部 分 提 到 过 )， 预 期 2025 年 前 因特网 中 的 32 位 地 
址 将 绝迹 。 


问题 与 练习 | | mn, :汪汪 

1 因特网 软件 层次 结构 的 哪些 层 不 需要 用 在 路 由 器 上 3 

2. 基于 TCP 协 议 的 传输 层 和 基于 UDP 协议 的 传输 层 之 间 有 哪些 区 别 ? 
3. 传输 层 如 何 确定 应 用 层 的 哪个 单元 应 当 接收 到 来 的 报 文 ? 

4. 怎样 阻止 因特网 上 的 计算 机 记录 所 有 途经 它 的 报 文 的 副本 ? 





4.5 安全 性 


一 台 计算 机 连接 到 网 络 上 时 ， 它 会 受到 未 授权 用 户 的 访问 和 恶意 破坏 。 本 节 讨 论 和 这 些 
问题 有 关 的 话题 。 


4.5.1 入 侵 的 形式 





通过 网 络 连接 对 计算 机 系统 及 其 内 容 进 行 侵袭 的 方法 有 很 多 种 ， 其 中 许多 都 会 用 到 怀 有 恶 
意 的 软件 ， 统 称 为 恶意 软件 (malware)。 这 类 软件 可 以 被 传送 到 某 台 计算 机 内 部 运行 ， 也 可 以 
远 距 离 攻击 计算 机 。 需 要 传送 到 受 攻击 计算 机 中 执行 的 软件 实例 包括 病毒 、 蠕 虫 、 特 洛 伊 木马 
和 间谍 软件 ， 这 些 软件 名 称 反 映 了 软件 的 主要 特征 。 






i gp 随后 ， 关 国 
国 级 研究 计划 局 (Defense Advanced Research Projects Agency, DARPA, 读 作 “DAR-pa” ) 
成 立 了 计算 机 应 急 响 应 小 组 ( Computer Emergency Response Team，CERT， 读 作 “SERT” )， 
并 在 卡 内 基 - 梅 隆 大 学 内 设立 了 CERT 协 调 中 心 。 CERT 是 因特网 安全 的 “监督 者 "， 其 职责 是 

有、 发 布 安全 警告 和 发 起 运动 提高 公众 的 因特网 安全 意识 。 CERT 协 调 中 心 的 网 站 
:eertorg， 上 面 有 其 活动 的 公告 ， 







病毒 (virus) 是 一 种 软件 ， 它 先 通过 将 自身 嵌入 到 计算 机 已 有 的 程序 中 来 感染 计算 机 ， 然 
后 ， 当 “宿主 ”程序 被 执行 时 ， 病 毒 也 会 被 执行 。 在 执行 时 ， 许 多 病毒 都 不 过 是 把 自身 传送 到 
计算 机 中 的 其 他 程序 上 ， 但 是 有 些 病毒 会 执行 破坏 性 的 动作 ， 例 如 ， 使 操作 系统 各 个 部 分 的 性 
能 下 降 ， 擦 除 海 量 存储 器 的 大 数据 块 ， 或 者 毁坏 数据 和 其 他 程序 。 

蠕虫 (worm) 是 一 个 独立 的 程序 ， 它 可 以 通过 网 络 传送 自己 ， 驻 留 在 计算 机 里 并 将 其 自己 

副本 转发 到 其 他 计算 机 。 和 病毒 的 情况 一 样 ， 蠕 虫 可 以 只 复制 自身 ， 也 可 以 实施 更 极端 的 破 
坏 行为 。 里 虫 的 一 个 典型 后 果 是 ， 蠕 虫 副本 的 激增 会 使 合法 应 用 的 性 能 下 降 ， 最 终 使 整个 网 络 
或 互联 网 过 载 。 

特洛伊 木马 〈Trojan horse) 是 一 种 伪装 成 吸引 人 的 程序 〈 如 游戏 或 有 用 的 实用 程序 包 ) 进 
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入 计算 机 系统 的 程序 ， 它 们 被 受害 者 自愿 引入 。 然 而 ,一旦 特洛伊 木马 程序 进入 计算 机 ， 它 就 
会 实施 可 能 有 不 良 影响 的 额外 活动 。 有 时 ， 这 些 额 外 活动 会 立即 开始 。 在 其 他 情况 下 ， 特 洛 伊 
木马 可 能 会 暂时 休 卢 ， 直 到 被 一 个 特殊 的 事件 触发 ， 如 一 个 预选 日 期 的 出 现 。 特 洛 伊 木马 常 第 
以 有 诱惑 力 的 电子 邮件 附件 的 形式 出 现 ， 当 这 类 附件 被 打开 时 〈 即 当 接 收 邮 件 者 请 求 浏览 附件 
时 )， 就 会 激活 特洛伊 木马 的 不 义 之 举 。 因 此 ， 决 不 要 打开 来 源 不 明 的 电子 邮件 附件 。 

恶意 软件 的 另 一 种 形式 是 间谍 软件 (spyware)， 有 时 称 为 嗅 探 (sniffing) 软件 ， 这 类 软件 
收集 它 所 驻 留 计算 机 的 活动 信息 ， 并 把 这 些 信息 报告 给 攻击 的 发 起 者 。 有 的 公司 使 用 间谍 软件 
来 建立 客户 档案 ， 这 种 做 法 本 身 的 道德 价值 值得 质疑 。 在 其 他 情况 下 ， 间 谍 软 件 被 用 于 公然 的 
恶意 行为 ， 如 通过 记录 计算 机 键盘 键入 的 符号 序列 ， 搜 索 口令 或 信用 卡 卡号 。 

间谍 软件 通过 嗅 探 方式 秘密 地 获取 信息 ， 与 此 相反 ， 网 络 仿冒 ”(phishing》 技 术 是 通过 简 
单 地 索要 信息 显 式 获取 信息 。 由 于 网 络 仿冒 的 过 程 就 是 撤 下 大 量 的 “ 线 ”， 等 人 “上 钧 ”， 所 以 
术语 网 络 仿冒 就 是 钓鱼 (fishing)〉 的 意思 。 网 络 仿冒 通常 用 电子 邮件 来 实施 ， 与 老式 电话 骗局 
差不多 。 骗 子 伪装 成 金融 机 构 、 政 府 机 关 或 者 执法 机 构 发 送 电 子 邮 件 信息 ， 向 潜在 受害 者 索要 
假装 用 于 合法 目的 的 信息 ， 而 实际 上 ， 这 些 信息 被 骗子 恶意 使 用 。 

与 遭受 病毒 和 间谍 软件 等 内 部 感染 不 同 ， 网 络 中 的 计算 机 还 能 够 被 系统 中 其 他 计算 机 所 运 
行 的 软件 攻击 。 拒 绝 服务 (denial of service，DoS ) 攻击 就 是 其 中 的 一 个 例子 ， 这 种 攻击 会 使 计 
算 机 的 信息 过 载 。 拒 绝 服务 攻击 已 经 向 因特网 的 大 型 商业 万 维 网 服务 器 发 起 攻击 ， 从 而 破坏 公 
司 的 业务 ， 有 时 甚至 曾 导致 一 些 公司 的 商业 活动 中 断 。 

拒绝 服务 攻击 需要 在 短暂 的 时 间 内 产生 大 量 的 信息 。 为 此 ， 攻 击 者 通常 在 大 量 未 设防 的 计 
算 机 内 植 入 一 种 能 在 收 到 信号 时 发 送信 息 的 软件 ， 然 后 ， 只 要 发 出 信号 ， 所 有 这 些 计算 机 ， 有 
时 称 为 僵尸 网 络 (botnet)， 就 会 用 信息 淹没 目标 计算 机 。 因 而 ， 拒 绝 服务 攻击 的 实质 是 把 未 设 
防 的 计算 机 用 作 帮 凶 。 这 就 是 为 什么 所 有 的 PC 用 户 都 被 劝阻 在 不 使 用 因特网 时 要 让 他 们 的 计算 
机 离开 因特网 连接 的 原因 。 据 估计 ，PC 一 旦 连接 到 因特网 ，20 分 钟 内 就 至 少 有 一 个 入 侵 者 会 尝 
试 利用 它 。 因 此 ， 一 台 未 设防 的 PC 就 是 对 因特网 安全 性 的 一 个 严重 威胁 。 

另 一 个 和 大 量 无 用 信息 有 关 的 问题 是 散布 称 为 垃圾 邮件 〈spam) 的 无 用 垃圾 邮件 。 然 而 ， 
和 拒绝 服务 攻击 不 同 的 是 ， 垃 圾 邮件 的 数量 不 足以 压 震 计算 机 系统 。 相 反 ， 垃 圾 邮件 的 作用 是 
压 夫 接收 垃圾 邮件 的 人 。 正 如 我 们 所 看 到 的 ， 这 一 问题 已 经 被 复杂 化 了 ， 垃 圾 邮件 这 一 媒介 被 
大 量 用 于 网 络 仿冒 和 煽动 可 以 传播 病毒 及 其 他 恶意 软件 的 特洛伊 木马 。 


4.5.2 ”防护 和 对 策 


老话 “一 分 预防 胜似 十 分 治疗 ”对 于 控制 网 络 连接 上 的 故意 破坏 情况 来 说 无 疑 是 正确 的 。 
一 个 主要 的 防护 技术 是 过 滤 穿 过 网 络 某 一 重要 节点 的 通信 流 ， 通 常 使 用 称 为 防火 墙 (firewall) 
的 软件 。 例 如 ， 防 火 墙 可 能 安装 在 组 织 内 联网 的 网 关 处 来 过 滤 进 出 这 个 区 域 的 信息 。 这 种 防火 
墙 设计 的 目的 是 ， 阻 止 向 某 些 特定 目的 地 址 发 送信 息 或 者 阻止 接受 已 知 的 有 问题 的 来 源 所 发 送 
的 信息 。 后 一 种 功能 可 以 用 来 终止 拒绝 服务 攻击 ， 因 为 它 提 供 了 阻止 来 自 具 有 攻击 性 计算 机 的 
通信 量 的 方法 。 安 装 在 网 关 处 的 防火 墙 的 另 一 个 常见 的 作用 是 ， 阻 止 所 有 源 地 址 位 于 通过 网 关 
接 入 该 区 域 的 所 有 进入 信息 ， 因 为 这 样 的 信息 表明 有 外 人 假装 区 域内 成 员 。 把 自己 伪装 成 其 他 
成 员 的 行为 称 为 欺骗 (spoofing)。 

防火 墙 不 但 能 用 于 保护 整个 网 络 或 域 ， 还 能 用 于 保护 个 人 计算 机 。 例 如 ， 如 果 一 台 计 算 机 
没有 用 作 万 维 网 服务 器 、 域 名 服务 器 或 电子 邮件 服务 器 ， 那 么 安装 在 这 台 计 算 机 上 的 防火 墙 应 


@ 又 称 网 络 钓鱼 或 网 络 欺 诈 。 一 一 译 者 注 。 
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当 阻止 所 有 和 针对 这 些 应 用 的 进入 通信 流 。 实 际 上 ， 入 侵 者 获得 计算 机 入 口 的 一 个 途径 就 是 通过 
一 个 已 经 不 存在 的 服务 器 所 留 下 的 “漏洞 ”来 建立 联系 。 尤 其 是 ， 利 用 间谍 软件 获取 信息 的 一 
个 方法 就 是 在 感染 的 计算 机 上 建立 一 个 秘密 的 服务 器 ， 通 过 这 个 服务 器 ， 恶 意 客户 端 可 以 获取 
间谍 软件 的 噢 探 结 果 。 正 确 安 装 防火 墙 可 以 阻止 来 自 这 类 恶意 客户 端的 报 文 。 

还 有 些 防 火 墙 的 变种 是 为 一 些 特殊 目的 设计 的 ， 垃 圾 邮件 过 滤器 (spam filter) 就 是 其 中 一 
例 ， 设 计 这 种 防火 墙 是 为 了 阻止 一 些 无 用 邮件 。 许 多 垃圾 邮件 过 滤器 在 区 分 正常 邮件 和 垃圾 邮 
件 时 采用 了 相当 复杂 的 技术 。 一 些 过 滤器 通过 一 个 训练 过 程 来 学 习 区 分 : 先 由 用 户 确定 哪些 属 
于 垃圾 邮件 ， 过 滤器 获得 了 足够 多 的 例子 后 可 以 自行 作出 判断 。 这 些 过 滤器 是 “将 各 种 不 同 的 
学 科 领 域 ( 如 概率 论 、 人 工 智能 等 ) 联合 起 来 可 以 推动 其 他 领域 发 展 ”的 例子 。 

男 一 种 有 过 滤 功 能 的 防护 工具 就 是 代理 服务 器 (proxy server)。 代 理 服 务 器 是 一 个 软件 单元 ， 
它 作为 客户 机 和 服务 器 之 间 的 中 介 ， 目 标 是 保护 客户 机 屏蔽 来 自 服务 器 的 不 利 行为 。 如 果 没 有 
代理 服务 器 ， 客 户 机 将 直接 与 服务 器 通信 ， 这 意味 着 服务 器 有 机 会 获得 客户 机 一 定量 的 信息 。 
由 于 同一 个 组 织 的 内 联网 内 的 许多 客户 机 都 与 远程 的 服务 嚣 通信， 长此以往 ， 该 服务 器 就 能 收 
集 关 于 内 联网 内 部 结构 的 大 量 信 息 ， 而 这 些 信息 在 以 后 可 被 用 于 恶意 活动 。 为 了 防范 这 一 点 ， 
组 织 可 以 建立 一 个 代理 服务 器 ， 用 于 特定 种 类 的 服务 (如 FTP、HTTP 和 远程 登录 服务 等 )， 这 
样 ， 每 次 内 联网 内 的 客户 机 试图 连接 某 个 类 型 的 服务 器 时 ， 实 际 上 连接 的 都 是 代理 服务 器 。 于 
是 ， 代 理 服 务 器 扮演 了 客户 机 的 角色 与 实际 的 服务 器 联系 。 此 后 代理 服务 器 就 一 直 扮演 实际 客 
户 机 与 实际 服务 器 之 间 的 中 介 ， 来 回 中 继 报 文 。 这 种 设置 的 第 一 个 好 处 在 于 ， 实 际 服务 器 无 法 
知道 代理 服务 器 是 不 是 真 的 客户 机 ， 事 实 上 ， 它 永远 不 会 意识 到 实际 客户 机 的 存在 。 这 样 一 来 ， 
实际 服务 器 就 无 法 了 解 内 联网 的 内 部 特性 。 第 二 个 好 处 在 于 ， 代 理 服务 器 能 够 过 滤 服 务 器 发 往 
客户 机 的 所 有 报 文 。 例 如 ，FTP 代 理 服务 器 能 够 检查 所 有 的 进入 文件 ， 看 是 否 感染 了 当前 已 知 
的 病毒 ， 然 后 阻止 所 有 感染 了 病毒 的 文件 进入 。 

另 一 种 用 于 防止 网 络 环境 中 的 问题 的 工具 是 审计 软件 ， 它 类 似 于 我 们 在 操作 系统 安全 性 的 
讨论 中 提 到 的 审计 软件 ( 见 3.5 节 )。 通 过 网 络 审计 软件 ， 系 统管 理 员 能 够 察觉 到 管辖 范围 内 不 
同位 置 突然 激增 的 报 文 流量 ， 监 控 系 统 防火 墙 的 活动 状态 ， 并 且 可 以 对 个 人 计算 机 的 请 求 模式 
进行 分 析 ， 以 探测 非 正常 行为 。 审 计 软 件 是 管理 员 用 于 及 早 发 现 问题 的 主要 工具 。 

另 一 种 防御 通过 网 络 连接 进行 入 侵 的 方法 就 是 采用 防 病毒 软件 (antivirus software)， 这 种 
软件 用 来 探测 和 移 除 被 已 知 病毒 或 其 他 方式 感染 的 文件 。( 实 际 上 ， 防 病毒 软件 代表 了 一 大 类 软 
件 产品 ， 每 一 种 软件 产品 都 被 设计 成 探测 和 移 除 某 一 特定 类 型 的 感染 文件 。 例 如 ， 许 多 产品 专 
门 研究 病毒 控制 ， 另 外 一 些 产品 则 专门 研究 间谍 软件 防护 。) 重要 的 是 ， 这些 软 件 包 的 用 户 需 要 
理解 ， 正 如 生物 系统 一 样 ， 新 的 计算 机 病毒 感染 会 不 断 地 出 现 ， 所 以 需要 不 断 地 更 新 疫苗 。 因 
此 ， 防 病毒 软件 必须 要 从 软件 提供 商 那 里 定期 下 载 更 新 。 然 而 ， 即 使 是 这 样 也 不 能 保证 计算 机 
的 绝对 安全 。 毕 竟 ， 在 新 病毒 被 发 现 和 疫苗 产生 之 前 ， 它 一 定 是 先 感染 了 一 些 计算 机 的 。 因 此 ， 
明智 的 计算 机 用 户 从 不 打开 一 个 不 熟悉 来 源 的 电子 邮件 中 的 附件 ， 从 不 在 未 事先 确认 软件 可 靠 
性 的 情况 下 下 载 软件 ， 从 不 要 轻易 响应 弹出 广告 ， 从 不 在 PC 没有 必要 连接 在 因特网 上 时 还 将 其 
连接 在 因特网 上 。 


4.5.3 加 密 

有 时 网 络 破坏 行为 的 目的 是 干扰 系统 (如 拒绝 服务 攻击 ), 但 有 时 其 最 终 目标 是 获取 信息 的 
访问 权 。 保 护 信 息 的 传统 方法 是 通过 口令 来 控制 对 信息 的 访问 。 然 而 ， 当 数据 通过 网 络 和 互联 
网 传送 时 ， 报 文 会 被 一 些 未 知 的 实体 中 继 ， 因 此 口令 安全 性 就 会 受到 威胁 ， 从 而 没有 多 大 的 价 
值 。 在 这 样 的 情况 下 ， 可 以 使 用 加 密 ， 使 得 即使 这 些 数 据 落 入 不 怀 好 意 的 人 的 手中 ， 编 码 后 的 


4.5 安全 性 139 


言 息 依然 能 保持 其 机 密 性 。 现 在 ， 许 多 传统 的 因特网 应 用 已 经 进行 了 改变 ， 加 入 了 加 密 技术 ， 
产生 了 所 谓 的 应 用 的 “安全 版 本 ”。 

一 个 最 好 的 例子 就 是 HTTP 的 安全 版 本 一 一 HTTPS， 它 被 用 于 大 多 数 金 融 机构 ， 为 客户 账 
号 提供 安全 的 因特网 访问 。HTTPS 的 骨干 是 称 为 安全 套 接 字 层 (Secure Sockets Layer，SSL) 的 
协议 系统 ， 它 最 初 是 由 Netscape 公 司 开发 的 ， 用 来 为 万 维 网 中 的 客户 机 和 服务 器 提供 安全 的 通 
言 链 路 。 大 多 数 浏览 器 通过 在 计算 机 屏幕 上 显示 一 个 很 小 的 锁 图 标 来 表明 SSL 已 启用 。( 有 的 会 
用 图 标的 出 现 与 否 来 表示 是 否 正在 使 用 SSL; 其 他 的 则 通过 显示 锁 是 闭合 还 是 打开 的 来 表示 是 
和 否 正在 使 用 SSL。) 

在 加 密 领 域 里 一 个 更 令 人 着 迷 的 话题 就 是 公 钥 加 密 (public-key encryption)， 加 密 系统 使 用 
公 钥 加 密 技 术 ， 能 令 人 即使 知道 报 文 是 如 何 加 密 的 ， 也 无 法 知道 如 何 解密 。 这 个 特性 看 起 来 好 
像 有 些 违反 直觉 ， 毕 竟 直 觉 告诉 我 们 ， 如 果 一 个 人 知道 怎样 对 报 文 进行 加 密 ， 那 么 他 就 应 该 能 
够 逆转 加 密 过 程 ， 对 报 文 进行 解密 。 但 是 ， 公 钥 加 密 技术 无 视 这 个 直觉 逻辑 。 

公 钥 加 密 系统 涉及 两 个 称 为 密 钥 的 值 的 使 用 。 一 个 密 钥 称 为 公 钥 (public key)， 用 来 对 报 
文 进行 加 密 ; 另 一 个 密 钥 称 为 私 钥 (private key)， 用 来 对 报 文 进行 解密 。 要 使 用 这 个 系统 ， 首 
先 要 将 公 钥 分 发 给 那些 需要 向 某 个 目的 地 发 送 报 文 的 一 方 ， 将 私 钥 秘密 地 保存 在 目的 地 端 。 然 
后 ， 报 文 发 起 方 可 以 用 公 钥 对 报 文 进行 加 密 ， 将 报 文 发 送 到 目的 地 ， 即 使 在 这 期 间 被 其 他 知道 
公 钥 的 中 间 人 截获 ， 也 仍 能 保证 它 的 内 容 是 安全 的 。 事 实 上， 唯一 能 对 报 文 进行 解密 的 是 在 报 
文 的 目的 地 持 有 私 钥 的 那 一 方 。 因 此 ， 如 果 Bob 创 建 了 一 个 公 钥 加 密 系 统 ， 并 把 公 钥 给 了 Alice 
和 Carol 这 两 个 人 ， 那 么 Alice 和 Carol 这 两 个 人 都 能 对 发 给 Bob 的 报 文 进行 加 密 ， 但 是 他 们 无 法 窥 
探 对 方 的 通信 。 事实 上 , 如 果 Carol 和 截获 了 来 自 Alice 的 报 文 , 即使 地 知道 Alice 是 怎样 进行 加 密 的 ， 
也 无 法 对 报 文 进行 解密 〈 见 图 4-16 )。 
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Carol 持 有 公 和 钥 人 a 
图 4-16” 公 和 钥 加 密 


公 钥 系统 中 存在 一 些小 问题 。 一 个 问题 就 是 ， 要 保证 所 用 的 公 钥 事实 上 对 目的 地 的 
那 一 方 而 言 是 一 个 正确 的 密 钥 。 举 例 来 说 ， 如 果 你 正在 和 银行 通信 ， 你 要 确保 你 用 来 加 密 的 公 
钥 是 针对 银行 的 ， 而 不 是 针对 冒名 顶替 者 的 。 如 果 一 个 冒名 顶替 者 让 自己 以 银行 的 身份 出 现 〈 一 


Alice 和 Carol 都 能 给 
mm Bob 持 有 私 钥 发送 加 密 的 报 广 
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个 欺骗 的 例子 )， 并 把 它 的 公 钥 给 你 ， 那 么 你 加 密 并 发 送 给 “银行 ”的 报 文 ， 对 这 位 冒名 顶替 者 
是 有 意义 的 ， 但 对 银行 没 意 义 。 因 此 ， 将 公 钥 关联 到 正确 的 另 一 方 的 任务 很 重要 。 

解决 这 个 问题 的 一 个 办 法 就 是 建立 一 些 可 信任 的 称 为 认证 机 构 (certificate authority) 的 因 
特 网 站 点 ， 其 任务 是 维护 相关 方 的 准确 列表 以 及 他 们 的 公 钥 。 于 是 ， 这 些 起 着 服务 器 作用 的 机 
构 ， 以 称 为 证 书 〈certificate) 的 软件 包 的 形式 ， 为 他 们 的 客户 提供 了 可 靠 的 公 钥 信息 。 证 书 是 
一 个 软件 包 ， 它 包含 有 关 方 的 名 称 和 该 方 的 公 钥 。 现 在 在 因特网 上 有 许多 商业 认证 机 构 ， 但 
为 了 保持 对 组 织 通信 安全 性 的 更 严格 控制 ， 由 组 织 来 维护 他 们 自己 的 认证 机 构 也 很 常见 。 

最 后 ， 我 们 应 该 在 解决 鉴别 〈authentication ) 问题 方面 对 公 钥 加 密 系统 进行 一 下 说 明 ， 鉴 别 
就 是 要 确保 报 文 的 作者 实际 上 确实 是 他 们 声称 的 那 一 方 。 这 里 关键 的 问题 就 在 于 ， 在 有 些 公 钥 加 
密 系 统 中 ， 加 密 密 钥 和 解密 密 钥 的 作用 可 以 转换 。 也 就 是 说 ， 原 文 可 以 由 私 钥 来 加 密 ， 并 且 因 为 
只 有 一 方 可 以 访问 这 个 密 钥 , 所 以 这 样 加 密 的 任何 原文 都 必须 是 从 那 一 方 产生 的 。 在 这 种 方式 下 ， 
私 钥 的 持 有 者 就 能 产生 一 个 位 模式 ， 称 为 数字 签名 (digital signature)， 只 有 那 一 方才 知道 应 怎么 
生成 。 通 过 对 报 文 附加 这 样 的 签名 ， 发 送 者 就 能 对 报 文 做 可 以 信任 的 标记 。 数 字 签 名 可 以 和 报 文 
本 身 的 加 密 版 本 一 样 简单 。 发 送 方 必须 要 做 的 事情 就 是 用 自己 的 私 钥 〈 这 个 密 钥 通常 用 作 解 密 ) 
对 要 发 送 的 报 文 进行 加 密 。 当 接收 方 收 到 报 文 时 ， 利 用 发 送 方 的 公 钥 对 这 个 签名 进行 解密 。 这 样 
得 出 的 报 文 就 能 保证 其 可 信 性 ， 因 为 只 有 私 钥 的 持 有 方才 能 产生 该 加 密 版 本 。 

在 第 12 章 的 末尾 ， 我 们 还 会 回 到 公 钥 加 密 的 话题 上 来 ， 举 一 个 复杂 计算 机 算法 的 例子 。 


4.5.4 网 络 安全 的 法 律 途径 


另 一 种 增强 计算 机 网 络 系统 安全 性 的 方法 就 是 应 用 法 律 补 救 措施 。 然 而 ， 这 种 方法 有 两 个 
障碍 。 第 一 个 障碍 在 于 ， 认 定 一 个 行为 不 合法 ， 并 不 意味 着 会 排除 该 行为 ， 而 只 是 提供 了 一 个 
法 律 依靠 而 已 。 第 二 个 障碍 在 于 ， 网 络 的 国际 特性 意味 着 要 获得 依靠 通常 是 很 困难 的 。 在 一 个 
国家 中 不 合法 ， 但 在 男 一 个 国家 中 却 可 能 是 合法 的 。 最 终 ， 通 过 法 律 途 径 来 增强 网 络 安全 性 是 
一 个 国际 性 的 问题 ， 所 以 必须 由 国际 法 律 机 构 〈 一 个 可 能 的 机 构 将 是 位 于 海牙 的 国际 法 庭 ) 来 
处 理 。 

尽管 这 么 说 ， 我 们 必须 承认 ， 虽 然 法 律 措 施 并 不 完美 ， 但 还 是 有 很 大 影响 力 的 ， 所 以 对 我 们 
而 言 ， 在 网 络 领域 里 ， 研 究 用 来 解决 冲突 的 一 些 法 律 步骤 还 是 有 必要 的 。 为 此 目的 ， 我 们 用 美国 
联邦 法 律 中 的 例子 来 进行 说 明 。 另 外 ， 还 可 以 从 其 他 一 些 政体 ， 如 欧盟 ， 找 到 类 似 的 例子 。 

首先 讨论 恶意 软件 的 扩散 问题 。 在 美国 , 这 个 问题 是 由 《计算 机 欺诈 和 滥用 法 》(Computer Fraud 
and Abuse Act) 提出 的 ， 该 法 案 于 1984 年 首次 通过 ， 其 后 做 了 几 次 修改 。 通 过 这 个 法 案 ， 涉 及 
蠕虫 和 病毒 制造 的 大 多 数 案 例 都 已 经 被 起 诉 。 简 而 言 之 ， 这 个 法 案 需 要 证 据 证 明 ， 被 告 有 意 引 
起 一 段 会 故意 造成 破坏 的 程序 或 数据 的 传播 。《 计 算 机 欺诈 和 滥用 法 》 还 涵盖 了 涉及 信息 盗 镭 的 
案例 。 具 体 来 说 ， 这 个 法 案 规定 ， 通 过 未 授权 的 方式 访问 计算 机 并 获取 任何 有 价值 的 信息 的 行 
为 均 不 合法 。 法 院 已 经 对 “任何 有 价值 的 ”赋予 了 广泛 的 解释 ， 所 以 《计算 机 欺诈 和 滥用 法 》 
已 经 不 仅仅 适用 于 信息 盗窃 的 情况 。 例 如 ， 法 院 规 定 ， 仅 仅 是 使 用 了 计算 机 就 可 以 算 作 是 “ 任 
何 有 价值 的 ”。 

在 法 律 界 ， 隐 私 权 是 男 一 个 ， 也 许 是 最 富有 和 争议 的 ， 网 络 问 题 。 这 样 的 问题 包括 雇主 是 否 
有 权 监 控 员 工 的 通信 ， 以 及 因特网 服务 提供 商 在 多 大 程度 上 有 权 访 问 其 客户 正在 交流 的 信息 ， 
这 些 问 题 已 经 得 到 了 相当 多 的 关注 。 在 美国 ， 这 些 问 题 有 许多 已 经 在 1986 年 的 《电子 通信 隐私 
法 》(Electronic Communication Privacy Act，ECPA) 中 提 到 ， 这 个 法 案 起 初 是 为 控制 搭 线 监听 
设立 的 。 虽 然 法 案 很 长 ， 但 是 仍 能 从 几 段 短 的 摘录 中 捕捉 到 它 的 意图 。 比 如 ， 它 声明 
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除了 本 章 中 特别 提 到 的 ， 任 何 有 意 截 取 、 力 图 截取 或 者 唆使 他 人 截取 或 力图 截取 
任何 有 线 、 口头 或 电子 通信 …… 的 人 应 按照 子 条 款 (4) 受 到 惩罚 , 或 者 按照 子 条 款 (5) 
受到 起 诉 。 


还 有 


任何 向 公众 提供 电子 通信 服务 的 个 人 或 实体 ， 不 得 在 服务 时 有 意 将 任何 通信 
的 内 容 …… 汇 露 给 除了 这 些 通信 的 收 件 人 或 意 想 的 接收 人 人 ， 或 者 这 些 收 件 人 或 意 想 的 
接收 和 的 代理 人 之 外 的 任何 人 。 


简 而 言 之 ，ECPA 确 认 了 个 人 秘密 通信 的 权利 ， 因 特 网 服务 提供 商 泄 露 有 关 其 客户 的 通信 信 
息 是 非法 的 ， 并 且 未 授权 用 户 偷 听 他 人 的 通信 也 是 非法 的 。 但 是 ，ECPA 留 下 了 一 些 有 争论 的 地 
方 。 例 如 ， 关 于 雇主 监视 雇员 的 通信 的 权利 问题 变 成 了 一 个 授权 问题 ， 在 这 个 问题 上 ， 当 雇员 
用 雇主 的 设备 实施 通信 时 ， 法 院 倾向 于 给 予 雇主 这 项 权力 。 

此 外 ， 这 个 法 案 在 某 些 条 件 限 制 下 ， 会 给 某 些 政府 部 门 监控 电子 通信 的 权利 。 这 些 规 定 已 经 引 
发 了 很 多 和 争论。 例如 ， 在 2000 年 ，FBI 披 露 了 它 拥有 一 个 Carnivore 系 统 ， 该 系统 能 报告 一 个 因特网 
服务 提供 商 的 所 有 订户 的 通信 信息 ， 而 不 仅仅 是 法 庭 认可 的 目标 。 在 2001 年 ， 为 了 回应 针对 世界 贸 
易 中 心 的 恐怖 天 击 ， 美 国 国会 通过 了 富有 争议 的 美国 爱国 者 (Uniting and Strengthening America by 
Providing Appropriate Tools Required to Intercept and Obstruct Terrorism，USA PATRIOT) 法 案 ， 
该 法 案 修 改 了 政府 部 门 所 受 的 限制 。 后 来 在 2013 年 ， 有 消息 透露 说 ， 这 些 法 律 已 经 被 无 差别 地 
解释 为 授权 收集 大 量 普通 美国 民众 电话 和 因特网 使 用 数据 。 

提供 这 种 监控 权利 除了 引起 了 法 律 和 道德 上 的 争论 外 ， 还 引起 了 与 我 们 的 研究 更 相关 的 一 
些 技术 问题 。 一 个 问题 是 ， 为 提供 这 些 能 力 ， 必 须 构 建 和 编制 通信 系统 ， 使 其 可 以 监控 通信 。 
建立 这 样 的 能 力 是 《通信 协助 执法 法 案 》(Communication Assistance for Law Enforcement Act， 
CALEA) 的 目标 。 它 要 求 电 信和 运营 商 修改 它们 的 设备 以 适应 法 律 强制 窃听 ， 而 这 个 需求 一 直 比 
较 复 杂 ， 实 现 起 来 也 非常 昂贵 。 

另 一 个 富有 争议 的 问题 涉及 政府 监控 通信 的 权利 与 公众 使 用 加 密 的 权利 之 间 的 冲突 。 如 果 
正 被 监控 的 报 文 加 密 得 很 好 ， 那 么 窃听 通信 对 于 法 律 强制 机 构 来 说 就 没有 多 大 价值 。 美 国 、 加 
拿 大 和 欧洲 各 国政 府 正在 考虑 要 求 注册 加 密 密 钥 的 系统 , 但 是 这 样 的 需求 受到 了 企业 界 的 反对 。 
毕竟 ， 由 于 商业 间谍 的 存在 ， 很 容易 理解 要 求 注册 加 密 密 钥 会 使 得 许多 遵守 法 律 的 公司 和 公民 
感到 不 和 舒服。 注册 系统 的 安全 性 有 多 高 ? 

最 后 ， 作 为 识别 因特网 环境 的 法 律 问题 的 范畴 的 一 种 工具 ， 我 们 引用 1999 年 美国 的 《 反 网 
络 域名 抢 注 消费 者 保护 法 》(Anticybersquatting Consumer Protection Act)， 设 计 这 个 法 案 是 为 了 
防止 冒名 顶替 者 建立 一 个 看 上 去 相似 的 域名 《〈 这 个 阴谋 就 称 为 域名 抢 注 ) 来 欺骗 组 织 。 这 个 法 
案 禁 止 使 用 与 其 他 商标 或 “普通 法 商标 ”一 样 的 或 相似 得 容易 引起 混淆 的 域名 。 一 个 作用 是 ， 
尽管 该 法 案 没 有 将 域名 的 投机 买卖 (就 是 注册 一 个 可 能 有 需求 的 域名 ， 以 后 再 将 该 域名 的 所 有 
权 卖 出 的 一 个 过 程 ) 视 为 不 合法 ， 但 是 它 限制 了 对 常用 域名 的 投机 买卖 。 因 此 ， 域 名 的 投机 买 
卖 者 可 能 能 够 合法 地 注册 一 个 常用 域名 ， 加 GreatUsedcars .com， 但 是 如 果 Big Al 公司 已 经 在 
从 事 二 手 车 业务 ， 那 么 他 就 不 可 能 注册 域名 BigAlUsedcars .com。 这 种 区 别 经 常会 在 与 《 反 
网 络 域名 抢 注 消费 者 保护 法 》 相 关 的 法 律 诉讼 案 中 成 为 争论 的 主题 。 


问题 与 练习 
1. 什么 是 网 络 仿冒 ?如何 保护 计算 机 来 抵御 网 络 仿冒 ? 
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2. 能 放 在 域 网 关 的 防火 墙 的 类 型 和 能 放 在 域内 单个 主机 上 的 防火 墙 的 类 型 之 间 有 什么 区 别 ? 
3. 从 技术 上 说 ， 术 语 数据 指 信息 的 表示 ， 而 信息 指 基 本 的 含义 。 口 令 保 护 的 是 数据 还 是 信息 ? 加 密 保护 


的 是 数据 还 是 信息 ? 


4， 和 较 传统 的 加 密 技 术 相 比 ， 公 钥 加 密 技 术 的 优势 是 什么 ? 


5. 和 防备 网 络 安全 问题 的 法 律 尝试 相关 的 问题 有 哪些 ? 


ore 


rE 





( 带 * 的 题目 涉及 选读 章节 的 内 容 。) 


下 


OD 


Ts 


什么 是 协议 ? 说 出 本 章 介绍 的 3 个 协议 ， 并 描 
述 每 个 协议 的 目的 。 


. 描述 客户 机 -服务 器 模型 。 

. 描述 对 等 模型 。 

. 说 出 3 种 分 布 式 计算 机 系统 。 

. 开放 式 网 络 和 封闭 式 网 络 之 间 的 区 别 是 什么 ? 

. 为 什么 CSMA/CD 协 议 不 能 应 用 于 无 线 网 络 ? 

. 描述 在 使 用 CSMA/CD 协 议 的 网 络 内 ， 一 台 机 
器 发 送 报 文 所 要 遵循 的 步骤 。 

. 什么 是 隐藏 终端 问题 ? 描述 解决 它 的 技术 。 

. 集线器 和 中 继 器 怎样 区 分 ? 

. 路 由 器 和 诸如 中 继 器 、 网 桥 及 交换 机 这 样 的 设 
备 怎样 区 分 ? 

. 网 络 和 互联 网 的 区 别 是 什么 ? 

. 说 出 网 络 中 用 来 控制 报 文 发 送 权 的 两 个 协议 。 


. 使 用 32 位 因特网 地 址 原先 被 认为 是 提供 了 足 


够 大 的 扩展 空间 ， 但 这 推测 被 证 实 并 不 准确 。 
IPv6 使 用 128 位 地 址 ， 这 将 被 证 明 是 足够 的 
吗 ? 证 明 你 的 答案 。( 例 如 ， 你 可 以 把 可 能 的 
地 址 数目 与 世界 的 人 口 进行 比较 。) 


. 用 点 分 十 进 制 记 数 法 为 下 列 位 模式 编码 。 


a. 000001010001001000100011 
b. 1000000000100000 
c. 0011000000011000 


. 下 列 点 分 十 进 制 记 数 法 表示 的 位 模式 分 别 是 


什么 ? 

a. 0.0 

b. 26.19.1 

c. 8.12.20.13 


.假设 因特网 上 一 个 终端 系统 的 地 址 是 


134.48.4.122, 那么 这 个 32 位 地 址 如 何 用 十 六 ; 
制 记 数 法 表示 ? 
什么 是 DNS 查找 ? 


18. 如 果 一 台 计 算 机 的 助 记 因特网 地 址 是 batman . 


batcave.metropolis.gov， 推 测 一 下 该 机 


24. 


25. 


26. 


27. 
28. 


器 所 在 域 的 结构 是 什么 样 的 ? 


. 解释 电子 邮件 地 址 kermiteanimals .com 


的 组 成 。 


. 在 VoIP 语 境 下 , 模拟 电话 适配器 和 嵌入 式 电 话 


的 区 别 是 什么 ? 


- 邮件 服务 器 的 作用 是 什么 ? 
. N- 单 播 与 多 播 的 区 别 是 什么 ? 
: 给 出 下 列 术语 的 定义 。 


a. 域名 服务 器 

b. 因特网 接 入 服务 提供 商 

c. 网 关 

d. 终端 系统 

给 出 下 列 名 词 的 定义 。 

a. 超 文本 

b. HTML 

Cc. 浏览 器 

因特网 的 许多 “外 行 用 户 ” 经常 混 用 因特网 和 
万 维 网 这 两 个 术语 。 这 两 个 术语 的 正确 含义 是 
指 什么 ? 

在 浏览 一 个 简单 的 网 页 时 ， 让 浏览 器 显示 该 文 
档 的 源 版 本 , 然后 说 出 该 文档 的 基本 结构 。 特 
别 是 ， 说 出 该 文档 的 头 和 体 , 并列 出 你 在 头 和 
体 中 发 现 的 一 些 语句 。 

列 出 5 种 HTML 标 签 ， 并 说 出 它们 的 含义 。 
修改 下 面 的 HTML 文 档 ， 使 单词 “Rover” 链 
接 到 URL 为 http://animals.org/pets/ 
dogs .html 的 文档 。 

<html> 

<head> 

<title>Example</title> 

</head> 

<body> 

<hl>My Pet Dog</h1> 

<p>My dog's name is Rover.</P> 
</body> 

</html> 


29. 男 一 个 草图 来 说 明 下 面 的 HTML 文 档 在 计算 
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机 屏幕 上 的 显示 信息 。 36. 如 果 要 浏览 器 在 下 列 两 个 URL“ 找 文档 ”， 浏 
<html> 览 器 的 动作 有 什么 不 同 ? 
<head> http://stargazer.universe.org 
<title>Example</title> https://stargazer.universe.org 
ren 37. 给 出 万 维 网 上 两 个 客户 端 活 动 的 例子 和 两 个 
<hl> My Pet Dog</hl> 服务 器 端 活动 的 例子 。 
<img src = "Rover .Jpg"> *38, 什么 是 OSI 参 考 模型 ? 
</body> *39. 在 一 个 基于 总 线 型 拓扑 结构 的 网 络 里 , 总 线 对 
</html> 于 要 传送 报 文 的 机 器 是 必须 竞争 的 不 可 共享 
30. 使 用 本 章 介 绍 的 非 正 规 XML 风 格 来 设计 一 资源 。 在 这 种 环境 里 死 锁 〈 见 选读 的 3.4 节 ) 
个 标记 语言 ， 把 简单 的 代数 表达 式 表示 为 文 是 如 何 控制 的 ? 
本 文件 。 *40. 列 出 因特网 软件 层次 结构 的 4 层 ， 并 说 明 各 层 
31. 使 用 本 章 介 绍 的 非 正规 XML 风格 设计 一 组 标 所 完成 的 任务 。 
签 ， 字 处 理 程序 可 能 用 到 这 些 标签 标记 潜在 的 *41. 为 什么 传输 层 把 长 报 文 划分 为 小 分 组 ? 
文本 。 例 如 ， 一 个 字 处 理 程序 如 何 指示 出 什么 *42. 当 某 应 用 程序 要 求 传 输 层 使 用 TCP 来 发 送 报 
文本 应 该 是 粗 体 、 斜 体 、 带 下 划 线 的 等 ? 文 时 , 为 了 满足 应 用 层 的 要 求 , 传输 层 需要 附 
32. 用 本 章 介绍 的 非 正 规 XML 风 格 来 设计 一 组 标 加 什么 样 的 报 文 ? 
签 , 使 得 可 以 根据 文本 项 在 打印 页 上 的 出 现 方 “43. 在 实现 传输 层 时 , 什么 情况 FTCP 优 于 UDP? 
式 给 运动 图 像 评论 做 标记 。 然 后 再 设计 一 组 标 什么 情况 下 UDP 优 于 TCP? 
签 , 可 以 用 于 根据 文本 中 这 些 项 的 含义 标记 这 *44. 说 UDP 是 无 连接 协议 的 含义 是 什么 ? 
些 评论 。 *45. 在 TCP/IP 协 议 层 次 结构 里 ， 为 了 用 下 列 方法 过 
33. 用 本 章 介绍 的 非 正 规 XML 风 格 来 设计 一 组 标 滤 进 来 的 通信 流 ， 防 火 墙 应 该 设置 在 哪 一 层 ? 
签 , 可 以 用 于 根据 文本 项 在 打印 页 上 的 出 现 方 a 报 文 内 容 
式 给 有 关 体育 赛事 的 文章 做 标记 。 然 后 再 设计 b. 源 地 址 
一 组 标签 , 可 以 用 于 根据 文本 中 这 些 项 的 含义 c- 应 用 类 型 
标记 这 些 文章 。 46. 假定 你 想 建 立 一 个 可 以 过 滤 掉 包含 某 些 术语 
34. 说 出 下 面 URL 的 组 成 ， 并 描述 各 项 的 含义 。 和 短语 的 电子 邮件 报 文 的 防火 墙 。 这 个 防火 墙 
http://lifeforms.com/animals/ 应 该 放 在 域 的 网 关上 , 还 是 放 在 域 的 邮件 服务 
moviestars/kermit.html 器 上 ? 说 明理 由 。 
35. 说 出 下 列 简 写 URL 的 组 成 。 47. 什么 是 代理 服务 器 ? 使 用 代理 服务 器 有 什么 好 处 ? 
a. http://www.farmtools.org/windmills. 48. 总 结 公 钥 加 密 的 原理 。 
html 49. 一 台 空 闲 但 未 设防 的 PC 是 如 何 威 胁 因 特 网 的 ? 
b. http://castles.org/ 50. 因特网 的 全 球 性 是 如 何 限制 因特网 问题 的 法 
C. WWW .Coolstuff.com 律 解决 方案 的 ? 
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希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 道德 、 社 会 和 法 律 问题 。 回 答 出 这 
些 问 题 还 不 够 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 
1. 通过 网 络 连接 计算 机 的 能 力 使 得 在 家 办 公 的 观念 流行 起 来 。 这 种 变化 有 哪些 利弊 ? 它 对 
自然 资源 的 消费 有 什么 影响 ? 它 会 使 家 庭 巩固 吗 ? 它 会 减少 “办 公 室 政治 ” 吗 ? 在 家 里 
办 公 的 人 和 在 现场 办 公 的 人 会 有 同样 的 职务 晋升 机 会 吗 ? 社会 联系 会 被 削弱 吗 ? 减少 和 
同行 之 间 的 个 人 接触 是 会 有 正面 的 影响 ， 还 是 会 有 负面 的 影响 ? 


144 第 4 章 组 网 及 因特网 


MD 


. 通过 因特网 订购 商品 正在 变 成 “亲身 ”购物 的 一 个 替代 行为 。 这 种 购物 习惯 的 变化 对 于 
社会 有 什么 影响 ?” 对 于 大 型 购物 中 心 的 影响 呢 ? 对 于 你 通常 上 只 有 逛 不 买 的 ， 比 如 书店 和 服 
装 店 之 类 的 小 店 呢 ? 以 尽 可 能 最 低 的 价格 购买 ， 到 什么 程度 称 之 为 好 ， 到 什么 程度 称 之 
为 不 好 ? 你 是 和 否 有 这 样 的 道义 上 的 责任 ， 多 花 一 点 钱 购 买 一 个 商品 来 支持 本 地 的 商业 ? 
比较 本 地 商店 里 的 商品 ， 然 后 通过 因特网 以 较 低 的 价格 订购 ， 这 道德 吗 ? 这 种 行为 的 长 
期 影响 会 是 什么 ? 

. 政府 对 其 公民 访问 因特网 (或 其 他 国际 性 网 络 〉 的 控制 应 当 限 制 在 什么 程度 内 ? 对 于 涉 
及 国家 安全 的 问题 呢 ? 可 能 发 生 哪 些 安全 问题 ? 

. 电子 公告 牌 允 许 网 络 用 户 发 布 消息 〈 常 以 匿名 方式 ) 和 阅读 其 他 用 户 发 布 的 消息 。 这 个 
公告 牌 的 管理 人 员 应 该 对 公告 牌 的 内 容 负 责 吗 ?电话 公司 应 该 对 电话 的 通话 内 容 负责 
吗 ? 食品 杂货 店 的 管理 者 要 对 店内 的 社团 公告 牌 内 容 负责 吗 ? 

. 因特网 的 使 用 应 当 被 监视 吗 ? 应 当 被 管制 吗 ? 如果 需要 ， 应 该 由 谁 来 管理 ， 管 理 到 什么 

程度 ? 

你 花费 多 少时 间 来 使 用 因特网 ? 那些 时 间 花 得 值 吗 ? 上 网 改变 你 的 社会 活动 了 吗 ? 你 认 

为 通过 因特网 与 人 交谈 比 面对面 与 人 交谈 更 容易 吗 ? 

. 当 你 为 个 人 计算 机 购买 软件 包 时 ， 开 发 者 通常 要 你 向 开发 者 注册 ， 以 便 你 可 以 得 到 未 来 
升级 的 通知 。 这 种 注册 过 程 越 来 越 多 地 通过 因特网 处 理 ， 经 常 要 你 提供 诸如 姓名 、 地 址 
以 及 你 如 何 得 知 该 产品 等 信息 ， 然 后 开发 者 的 软件 自动 把 这 些 数 据 传输 给 开发 者 。 如 果 
开发 者 设计 的 注册 软件 在 注册 过 程 中 还 把 额外 的 信息 发 送 给 了 开发 者 ， 那 么 会 发 生 什 么 
道德 问题 吗 ? 比如 ， 注 册 软 件 可 能 扫描 你 系统 的 内 容 ， 报 告 找到 的 其 他 软件 包 。 

. 访问 一 个 网 站 时 ， 这 个 站 点 有 在 你 计算 机 内 记录 数据 〈 称 为 cookie) 的 能 力 ， 从 而 表明 你 
曾经 访问 过 该 站 点 。 然 后 这 些 cookie 可 被 用 来 识别 回访 的 访问 者 并 记录 他 们 以 前 的 活动 ， 
以 便 网 站 可 以 更 高 效 地 处 理 访问 者 对 网 站 的 未 来 访问 。 计 算 机 上 的 cookie 还 可 提供 你 访问 
网 站 的 记录 。 网 站 应 该 有 在 你 的 计算 机 内 记录 cookie 的 功能 吗 ? 未 经 你 的 同意 , 是 否 应 允 
许 网 站 在 你 的 计算 机 里 记录 cookie? cookie 的 好 处 可 能 是 什么 ? 使 用 cookie 可 能 会 引发 什 
么 问题 ? 

. 如 果 政 府 机 构 要 求 公司 注册 加 密 密 钥 ， 公 司 还 是 安全 的 吗 ? 

10. 一 般 来 说 ， 出 于 礼貌 我 们 不 会 为 了 安排 周末 外 出 之 类 的 个 人 或 社团 的 事情 而 给 在 工作 场 
所 的 朋友 打 电 话 。 类 似 地 ， 大 多 数 人 也 不 愿意 打 电 话 到 客户 的 家 里 介绍 新 产品 。 按 照 类 
似 的 习俗 ， 我 们 把 婚礼 请 束 寄 到 客人 的 住所 ， 而 把 商务 会 议 的 通知 邮寄 到 出 席 者 的 工作 
地 址 。 把 给 朋友 的 私人 电子 邮件 通过 他 工作 的 地 方 的 邮件 服务 器 发 送 合适 吗 ? 

. 假定 一 个 PC 的 所 有 者 让 这 人 台 PC 接 入 因特网 ， 但 最 终 这 台电 脑 被 其 他 人 用 来 进行 拒绝 服 
务 攻 击 。 这 个 PC 的 所 有 者 该 负 多 大 的 责任 ? 你 的 回答 和 他 是 否 安装 了 正确 的 防火 墙 有 
关 吗 ? 

.一 个 生产 糖果 或 玩具 的 公司 在 他 们 的 公司 网 站 上 提供 游戏 ， 在 推荐 公司 产品 的 同时 让 孩 
子 们 娱乐 ， 这 种 做 法 道德 吗 ? 如 果 游 戏 是 用 来 收集 小 孩 信 息 的 ， 那 又 如 何 ? 娱乐 、 广 告 
和 利用 之 间 的 界限 是 什么 ? 
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第 章 
算 法 


第 0 章 中 我 们 得 知 ， 计 算 机 科学 的 核心 主题 是 对 算法 的 研究 。 现 在 是 我 们 关注 这 个 核 
士 心 主题 的 时 候 了 。 我们 的 目标 是 探究 足够 的 基本 素材 来 真正 地 理解 和 认识 计算 科学 。 
本 章 内 容 
5.1 算法 的 概念 5.4 迭代 结构 
5.2 算法 的 表示 5.5 递归 结 
5.3 算法 的 发 现 5.6 ”效率 和 正确 性 


我 们 已 经 知道 ， 在 计算 机 能 够 执行 一 个 任务 之 前 ， 必 须 给 出 一 个 算法 精确 地 告诉 计算 机 做 
什么 。 因 此 ， 算 法 的 研究 是 计算 机 科学 的 基石 。 在 本 章 中 ， 我 们 将 介绍 算法 研究 的 许多 基本 概 
念 ， 包 括 算 法 的 发 现 和 表示 问题 以 及 算法 的 主要 控制 概念 一 一 迭代 和 递归 。 在 讲解 的 同时 ， 我 
们 还 会 介绍 儿 个 有 关 搜 索 和 排序 的 著名 算法 。 下 面 首先 介绍 算法 的 概念 。 


5.1 算法 的 概念 


在 第 0 章 “ 绪 论 ” 中 ， 我 们 把 算法 非 正 式 地 定义 为 描述 如 何 完成 任务 的 步骤 集 。 在 本 节 中 ， 
我 们 将 进一步 讨论 算法 的 基本 概念 。 


5.1.1 非 正 式 的 回顾 


在 前 面 的 学 习 中 ， 我 们 已 经 遇 到 了 许多 算法 。 我 们 发 现 了 用 来 进行 数 制 转换 的 算法 、 检 测 和 
纠正 数据 错误 的 算法 、 压 缩 和 解压 缩 数据 文 件 的 算法 、 在 多 任务 处 理 环境 中 控制 多 道 程序 设计 的 
算法 以 及 很 多 其 他 算法 。 此 外 , 我 们 已 经 看 到 , CPU 所 遵循 的 机 器 周期 只 不 过 是 下 面 这 个 简单 算法 。 

只 要 未 执行 暂停 指令 就 执行 以 下 步 又 : 

a。 取 一 条 指令 ; 

b 解码 该 指令 ; 

c， 执行 该 指令 。 

就 像 图 0-1 中 的 魔术 的 算法 所 展示 的 那样 ， 算 法 并 不 局 限于 技术 活动 ， 实 际 上 ， 它 甚至 可 以 
用 来 描述 剥 赣 豆 过 这 样 的 普通 活动 。 

获得 一 篮子 未 剥 壳 的 豌豆 和 一 只 空 碗 。 只 要 篮子 里 还 有 未 剥 壳 的 殉 豆 就 执行 下 面 的 步 又 : 

a， 从 篮子 里 拿 出 一 个 吏 豆 ; 

b 。 剥 开 竞 豆 的 豆 蔷 ， 

c， 把 剥落 的 豆 放 到 碗 里面 ; 

d， 扔 掉 空 豆 莱 。 
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实际 上 ， 许 多 研究 人 员 相 信 ， 人 脑 中 的 每 一 个 活动 ， 包 括 幻 想 、 创 造 和 决策 ， 实 际 上 都 是 
算法 执行 的 结果 一 一 我 们 将 在 学 习 人 工 智能 〈 第 11 章 ) 时 介绍 。 
但 是 ,在 继续 深入 研究 之 前 ， 让 我 们 先 考虑 一 下 算法 的 正式 定义 。 


5.1.2 ”算法 的 正式 定义 


在 日 常生 活 中 ， 我 们 可 以 使 用 非 正 式 的 、 未 经 严格 定义 的 概念 ， 而 且 这 种 概念 也 很 常见 ， 
但 是 科学 必须 建立 在 定义 明确 的 术语 之 上 。 因 此 , 我们 来 考虑 一 下 图 5-1 给 出 的 算法 的 正式 定义 。 





算法 是 定义 一 个 可 终止 过 程 的 一 组 无 歧义 的 、 可 执行 的 步骤 的 有 序 集合 。 


图 5-1 算法 的 定义 


注意 ， 该 定义 要 求 一 个 算法 中 的 步骤 集合 是 有 序 的 。 这 意味 着 ， 一 个 算法 中 的 各 个 步骤 必 
须 有 一 个 就 执行 顺序 而 言 非常 明确 的 结构 。 不 过 ,这 并 不 意味 着 这 些 步 又 必 须 从 第 1 步 到 第 2 步 ， 
再 到 下 一 步 ， 这 样 顺序 执行 。 有 些 算 法 ， 称 为 并 行 算法 ， 包 含 的 步骤 序列 不 只 一 个 ， 每 一 个 序 
列 都 被 设计 成 由 多 处 理 器 机 器 中 的 不 同 处 理 器 执行 。 在 这 种 情况 下 ， 整 个 算法 并 不 只 包含 一 个 
遵照 第 1 步 、 第 2 步 这 样 的 顺序 的 执行 流 ， 其 结构 是 一 种 多 执行 流 结构 ， 这 些 执行 流 在 整个 任 
务 的 不 同 部 分 被 不 同 的 处 理 器 执行 时 不 断 分 支 和 再 接合 。( 我 们 会 在 第 6 章 中 再 次 讨论 这 个 概 
念 。) 其 他 例子 包括 第 1 章 中 所 讲述 的 触发 器 电路 执行 的 算法 ， 这 个 电路 中 每 一 个 门 电路 都 完 
成 整个 算法 的 一 步 。 这 里 ， 这 些 步骤 是 按照 因果 关系 排列 的 ， 每 个 门 电路 的 动作 都 是 通过 电 
路 传播 的 。 

接 下 来 ， 我 们 考虑 算法 必须 由 可 执行 的 步骤 组 成 这 一 要 求 。 为 了 满足 这 个 条 件 ， 我 们 考虑 
下 面 这 条 指令 : 

给 出 一 个 所 有 正 整数 的 列表 
由 于 正 整 数 有 无 穷 多 个 ， 所 以 这 条 指令 是 不 可 能 完成 的 。 因 此 ， 任 何 包括 这 条 指令 的 指令 集 都 
不 能 称 作 一 个 算法 。 计 算 机 科学 家 使 用 有 效 的 〈effective) 这 个 术语 来 表示 可 执行 的 概念 。 也 就 
是 说 ， 说 算法 中 的 一 个 步骤 是 有 效 的 就 意味 着 它 是 可 执行 的 。 

图 $-1 中 的 算法 定义 的 另外 一 个 要 求 是 算法 中 的 步骤 必须 是 无 玻 义 的 。 这 意味 着 在 算法 的 
执行 过 程 中 ， 正 在 被 处 理 的 信息 必须 足以 唯一 地 、 完 整地 确定 每 一 步 所 需要 的 动作 。 换 名 话 
说 ， 算 法 中 的 每 一 步 的 执行 都 不 需要 创造 性 的 技能 ， 只 要 求 遵照 指令 执行 。( 在 第 12 章 我 们 
要 学 习 的 “算法 ” 称 为 非 确 定性 算法 ， 那 些 算法 不 受 这 里 的 限制 ， 属 于 另外 一 个 重要 的 研究 
论题 。) 

图 $-1 给 出 的 定义 还 要 求 ， 算 法 定义 的 是 一 个 可 终止 的 过 程 ， 也 就 是 说 ， 一 个 算法 的 执行 必 
须 能 够 最 终结 束 。 这 个 要 求 源 自 理论 计算 机 科学 ， 其 目标 是 要 回答 诸如 “算法 和 机 器 的 最 终 限 
制 是 什么 ? ”之 类 的 问题 。 其 中 ， 计 算 机 科学 试图 寻找 下 面 两 种 问题 的 区 别 : 哪些 问题 的 答案 
的 获得 在 算法 系统 能 力 范围 之 内 ， 哪 些 问题 的 答案 的 获得 超出 了 算法 系统 能 力 范围 。 从 这 个 意 
义 上 讲 ， 它 在 以 一 个 答案 告终 的 过 程 与 那些 只 能 向 前 执行 而 不 能 得 到 结果 的 过 程 之 间 存 在 着 一 
条 分 割 线 。 

可 是 ， 还 是 有 一 些 不 可 终止 的 过 程 是 非常 有 意义 的 ， 包 括 监 视 病 人 的 生命 特征 和 维持 飞行 
器 的 飞行 高 度 等 。 有 些 人 可 能 辩 称 这 些 问 题 仅仅 是 算法 的 重复 ， 这 其 中 的 每 一 个 算法 都 会 在 到 达 
结束 状态 之 后 自动 重复 执行 。 男 外 一 些 反对 这 一 论点 的 人 可 能 认为 ， 这 种 说 法 只 不 过 是 一 种 对 
于 正式 定义 限制 的 过 度 坚 持 。 不 管 是 哪 种 情况 ， 结 果 都 是 算法 这 个 名 词 经 常 被 用 在 一 些 不 必 非 
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要 定义 可 终止 过 程 的 实用 的 (或 者 非 正式 的 ) 步骤 集合 环境 中 。 例 如 ， 长 除法 “算法 ”没有 为 1 
除 以 3 定义 一 个 可 终止 的 过 程 。 从 技术 上 讲 ， 这 些 例子 都 表示 对 该 术语 的 误 用 。 


5.1.3 ”算法 的 抽象 本 质 


强调 算法 与 其 表示 的 区 别 是 非常 重要 的 ， 这 就 好 像 一 个 故事 和 一 本 书 的 区 别 。 一 个 故事 本 质 
上 是 抽象 的 ， 或 者 说 是 概念 上 的 ;而 一 本 书 是 一 个 故事 的 物理 表示 。 如 果 一 本 书 被 翻译 成 其 他 语 
言 或 者 以 另外 一 种 样式 出 版 ， 那 么 仅仅 是 这 个 故事 的 表示 形式 改变 了 ， 而 故事 本 身 并 没有 变化 。 

同样 ， 算 法 是 抽象 的 ， 与 它 的 表示 是 有 区 别 的 。 一 个 算法 可 以 用 多 种 方式 来 表示 。 比 如 ， 
在 华氏 温度 和 摄氏 温度 之 间 进 行 转换 的 算法 传统 上 可 以 用 下 面 的 代数 公式 表示 : 


F= 目 C+32 
. 
但 也 可 以 用 下 面 的 指令 表示 : 
将 摄氏 温度 数 信 乘 以 = ， 然 后 在 乘积 上 加 32 


甚至 可 以 用 电路 的 形式 予以 表示 。 无 论 哪 种 情况 ， 基 本 的 算法 是 一 致 的 ， 只 不 过 是 表示 方式 不 
同 轻 了 。 

算法 和 它 的 表示 ， 二 者 之 间 的 区 别 体现 了 我 们 在 传达 一 个 算法 的 时 候 存 在 的 问题 。 一 个 常 
见 的 例子 是 ， 一 个 算法 必须 描述 到 什么 样 的 细致 程度 。 对 于 气象 学 家 来 说 ， 指 令 “ 将 摄氏 度 读 
数 转换 为 相应 的 华氏 度 读数 ”就 足够 了 ， 但 是 ， 对 于 一 个 需要 更 详细 描述 的 外 行 来 说 ， 这 个 指 
令 可 能 就 是 模糊 的 、 有 歧义 的 。 然 而 ， 问 题 并 不 在 于 底层 算法 ， 而 是 算法 并 没有 很 好 地 按照 外 
行 所 要 求 的 细致 程度 进行 表示 。 在 下 一 节 中 ， 我 们 会 看 到 原 语 的 概念 是 如 何 被 用 于 消除 算法 表 
示 中 的 这 种 歧义 性 问题 的 。 

最 后 ， 在 算法 及 其 表示 这 个 主题 上 ， 我 们 应 该 明确 男 外 两 个 相关 概念 一 一 程序 和 进程 一 一 的 
区 别 。 程 序 是 一 个 算法 的 表示 。( 这 里 ,我 们 没有 在 正式 意义 上 使 用 术语 算法 ， 因 为 许多 程序 是 
不 可 终止 的 “算法 ”的 表示 。) 实际 上 ,在 计算 界 ， 术 语 程 序 通常 是 指 被 设计 成 计算 机 应 用 的 算 
法 的 表示 。 在 第 3 章 中 ， 我 们 把 进程 定义 为 执行 程序 的 活动 。 然 而 ， 需 要 注意 的 是 ， 执 行 一 个 程 
序 就 是 执行 由 该 程序 所 表示 的 算法 ， 所 以 一 个 进程 可 以 等 价 地 定义 为 执行 一 个 算法 的 活动 。 我 
们 可 以 得 到 这 种 结论 : 程序 、 算 法 和 进程 既是 不 同 的 又 是 有 关联 的 实体 。 程 序 是 算法 的 表示 ， 
而 进程 又 是 执行 算法 的 活动 。 





有 
第 1 步 ， 从 你 的 哈里 取出 一 硬币 并 且 把 它 放 到 子 上 ， 
第 2 步 ， 返回 第 1 步 。 om 


5.2 ”算法 的 表示 


在 本 节 中 , 我 们 考虑 与 算法 表示 有 关 的 问题 。 我 们 的 目标 是 引入 原 语 和 伪 代 码 的 基本 概念 ， 
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并 且 建 立 一 种 为 我 们 所 用 的 算法 表示 系统 。 
5.2.1 原 语 


一 个 算法 的 表示 需要 使 用 某 种 形式 的 语言 。 对 于 人 类 来 讲 ， 这 可 能 是 一 种 传统 的 自然 语言 
(英语 、 西 班 牙 语 、 俄 语 、 日 语 )， 也 可 能 是 一 种 图 形 语 言 ， 如 图 5-2 所 示 ， 在 这 个 图 中 ， 我 们 给 
出 了 用 一 张 正方 形 的 纸 折 出 一 只 鸟 的 算法 。 然 而 ， 这 种 自然 的 沟通 方式 常常 会 引起 误解 ， 有 些 
时 候 是 因为 算法 描述 中 使 用 的 术语 可 能 拥有 多 种 含义 。( 和 句子“Visiting grandchildren can be 
nerve-racking” 可 能 表示 孙子 来 访 时 会 车 出 事情 ,也 可 能 表示 去 看 孙子 是 一 件 很 费 周折 的 事情 。) 
所 需 的 详细 程度 引发 的 误解 也 可 能 导致 问题 。 很 少 有 读者 能 够 按照 图 $-2 给 出 的 步骤 成 功 地 折 出 
一 只 鸟 来 ， 但 是 一 个 专门 学 习 折纸 的 学 生 可 能 就 没什么 困难 。 简 言 之 ， 当 用 来 描述 算法 表示 的 
语言 并 没有 被 准确 定义 或 者 并 没有 给 予 足够 详细 的 信息 的 时 候 ， 就 会 产生 交流 问题 。 
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图 5-2 将 一 张 正方 形 的 纸 折 成 一 


计算 机 科学 解决 这 些 问 题 的 途径 是 建立 一 组 定义 明确 的 构造 块 ， 利 用 它们 来 构造 算法 的 表 
示 。 这 种 构造 块 称 作 原 语 〈primitive)。 赋 予 原 语 准确 的 定义 消除 了 很 多 由 于 歧义 造成 的 问题 ， 
并 且 要 求 按照 这 些 原 语 来 描述 算法 就 是 确定 了 一 致 的 细致 程度 。 原 语 的 集合 以 及 说 明 如 何 组 合 
这 些 原 语 来 表示 比较 复杂 的 想法 的 规则 集合 就 构成 了 程序 设计 语言 (programming language )。 

每 个 原 语 都 有 其 自己 的 语法 和 语义 。 语 法 是 指 原 语 的 符号 表示 ， 语 义 是 指 该 原 语 的 含义 。 
air 一 词 的 语法 由 3 个 符号 组 成 ， 而 其 语义 是 一 种 充满 整个 世界 的 气体 物质 。 作 为 一 个 例子 ， 
图 5-3 描 述 了 折纸 术 中 使 用 的 一 些 原 语 。 


语义 
将 纸 翻 面 ， 如 


ht 、 一 


纸 的 一 面 用 区 分 纸 的 两 面 ， 如 
阴影 表示 
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图 5-3 ”折纸 术 的 原 语 


为 了 获得 用 来 描述 由 计算 机 执行 的 算法 的 原 语 的 集合 ， 我 们 需要 借助 于 机 器 执行 的 单个 指令 。 
如 果 一 个 算法 在 这 个 级 别 上 加 以 描述 ， 我 们 肯定 会 得 到 一 个 适合 机 器 执行 的 程序 。 然 而 ， 在 这 个 级 
别 上 描述 算法 是 非常 单调 的 ， 所 以 我 们 一 般 使 用 一 些 “ 更 高 级 的 ” 原 语 ， 其 中 每 个 原 语 都 是 由 机 器 
语言 提供 的 较 低 级 的 原 语 组 成 的 一 个 抽象 工具 。 因 此 ， 我 们 可 以 得 到 一 个 概念 上 比 机 器 语言 更 高 级 
的 方式 来 描述 算法 的 正式 的 程序 设计 语言 。 我 们 将 在 下 一 章 中 讨论 这 种 程序 设计 语言 。 





设计 一 个 复杂 算法 的 任务 要 求 设计 者 了 解 众多 不 相关 的 概念 ,这 种 要 求 可 能 超过 了 人 脑 的 能 
力 。 因 此， 复杂 算法 的 设计 者 需要 一 种 方法 来 记录 不 断 发 展 的 算法 的 各 个 部 分 ， 以 备 不 时 之 需 。 

在 20 世 纪 50 年 代 和 60 和 年代， 流程 图 (算法 可 以 由 箭头 相互 连接 的 几何 图 形 表示 ) 是 最 顶 
类 的 设计 工具 。 然而， 流程 图 经 常 变 成 一 个 由 相互 交 又 的 箭头 组 成 的 复杂 网 ， 这 样 就 给 理解 
底层 算法 的 结构 带 来 了 难度 。 因此， 流程 图 这 种 设计 工具 只 能 让 位 于 其 他 表示 方法 。 一 个 例 
子 就 是 本 书 中 使 用 的 伪 代 码 ， 通 过 这 种 伪 代 码 ， 算 法 可 以 表示 成 定义 明确 的 文本 结构 。 另 一 
方面 ， 当 我 们 的 目标 是 表示 算法 而 非 设计 的 时 候 ， 流 程 图 仍旧 是 有 意义 的 。 例如， 图 5-8 和 图 
5-9 用 流程 图 展现 了 由 流行 的 控制 语句 表示 的 算法 结构 . 

对 于 更 优 的 设计 方法 的 研究 仍 在 继续 。 在 第 7 章 中 ， 我 们 将 看 到 使 用 图 形 技术 来 辅助 大 
型 软件 系统 全 球 性 设计 的 趋势 ,但 是 伪 代 码 在 设计 系统 中 小 一 些 的 过 程 化 构件 中 仍然 很 流行 . 


5.2 算法 的 表示 151 


5.2.2 伪 代 码 


现在 , 我 们 暂时 不 介绍 正式 的 程序 设计 语言 , 而 是 介绍 一 种 非 正式 但 更 加 直观 的 符号 系统 ， 
这 个 系统 称 作伪 代码 。 一 般 而 言 ， 伪 代码 (pseudocode) 是 一 种 在 算法 开发 过 程 中 非 正式 地 表 
达 思 想 的 符号 系统 。 

获得 伪 代 码 的 一 种 方法 是 , 简单 地 放宽 正式 程序 设计 语言 的 规则 , 借用 语言 的 语法 -语义 结 
构 ， 与 不 太 正式 的 构造 混合 在 一 起 。 因 为 存在 许多 种 程序 设计 语言 ， 所 以 这 样 的 伪 代 码 变 体 有 
许多 。 两 种 特别 流行 的 伪 代 码 是 Algol 语 言 和 Pascal 语 言 的 放宽 版 本 ， 主 要 是 因为 在 过 去 的 几 十 
年 里 ， 它 们 被 广泛 用 于 教材 和 学 术 论 文 。 最 近 ，Java 语 言 和 C 语 言 的 伪 代 码 怀 旧 者 已 经 激增 ， 同 
样 是 因为 大 多 数 程序 员 都 要 至 少 具 备 阅 读 这 些 语言 的 知识 。 无 论 伪 代 码 借用 哪 种 语言 的 语法 形 
式 ， 其 本 质 目的 都 是 为 了 表示 算法 : 伪 代 码 必 须 有 一 种 一 致 且 简洁 的 用 来 表示 循环 语义 结构 的 
表示 法 。 为 了 我 们 的 目的 ， 我 们 将 使 用 一 种 类 似 Python 的 语法 来 表示 贯穿 本 书 其 余部 分 的 伪 代 
码 。 我 们 的 一 些 伪 代码 语义 结构 将 借用 以 前 章节 中 的 语言 构造 ， 其 他 结构 将 在 本 书 未 来 的 章节 
中 正式 介绍 。 

一 种 这 样 的 循环 语义 结构 就 是 保存 计算 的 值 。 比 如 ,我 们 计算 了 文 票 账 户 Cchecking account) 
和 存款 账户 〈savings account) 上 的 余额 总 和 ， 并 打算 保存 这 个 结果 以 便 以 后 引用 。 在 这 种 情况 
下 ， 我 们 用 

name = expression 
的 形式 来 表达 ， 其 中 ，name (名 字 ) 是 我 们 欲 引用 结果 的 名 字 ， 而 exPression (表达 式 ) 则 
描述 的 是 其 结果 将 被 保存 的 计算 。 这 个 伪 代 码 构造 直接 照搬 了 Python 的 赋值 语句 〈assignment 
statement)， 该 语句 在 第 1 章 介绍 将 值 存 入 Python 变量 的 时 候 介 绍 过 。 例 如 ， 语 句 


RemainingFunds = CheckingBalance + SavingsBalance 


是 一 条 赋值 语句 , 它 把 CheckingBalance 与 SavingsBalance 和 的 和 赋 给 了 名 字 RemainingFunds。 
因此 ，RemainingFunds 可 以 用 在 将 来 引用 该 和 的 语句 中 。 

男 一 个 递归 语义 结构 是 ， 根 据 某 个 条 件 的 真 与 假 从 两 个 可 能 的 活动 中 选择 一 个 。 这 样 的 例 
子 有 : 


若 国内 生产 总 值 增长 了 ， 则 买 进 普通 股 ; 否则 ， 卖 出 普通 股 。 
若 国内 生产 总 值 增长 了 则 买 进 普通 股 ， 否 则 卖 出 普通 股 。 
买 进 或 卖 出 普通 股 取决 于 国内 生产 总 值 的 增长 或 减少 。 
其 中 每 个 语句 都 可 以 写成 符合 如 下 结构 的 形式 : 
if (条 件 ) : 
活动 
else: 
活动 


oy 并 b de ee 


= 下 
1 区 





ry 的 (3 和 white 结 点 构 的 语法 ， 以 及 函数 定义 和 调用 
语法 ) 十 分 相似 。 
if (条 件 ) : 

活动 
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这 里 ， 我 们 使 用 了 关键 字 i£ 如果) 和 else (否则 ) 来 指示 这 个 主 结构 中 的 不 同 子 结构 ， 并 且 
使 用 冒号 和 缩 进 限定 了 这 些 子 结构 的 边界 。 条 件 和 else 后 面 总 是 紧 跟着 一 个 冒号 。 相 应 的 活 
动 将 被 缩 进 。 如 果 活 动 由 多 个 步骤 组 成 ， 那 么 这 些 步骤 应 该 采用 同样 的 缩 进 。 通 过 对 我 们 的 
伪 代 码 采用 这 种 语法 结构 ， 我 们 便 得 到 了 可 以 表达 这 种 常用 语义 结构 的 统一 方法 。 因 此 ， 尽 
管 语句 


根据 该 年 份 是 否 是 闫 年 ， 总 数 相应 地 被 366 或 365 除 
可 能 会 产生 一 种 更 富有 创造 性 的 文字 风格 ， 但 是 我 们 将 坚持 选择 下 面 这 种 简单 的 形式 。 


if (年 份 是 状 年 ) : 
每 日 总 计 = 总 数 / 366 


else: 


每 日 总 计 = 总 数 / 365 
对 于 不 涉及 else 活 动 的 情况 ， 我 们 也 可 以 采用 下 面 这 种 较 短 的 语法 。 


if (条 件 ) : 
活动 


利用 这 种 表示 形式 ， 语 名 
如 果 处 于 销售 额 减少 的 场合 ， 那 么 价格 降低 5%。 
将 可 以 简化 为 


if (销售 有 所 下 降 ) : 
价格 降低 5% 


另 一 个 常用 的 语义 结构 是 ， 只 要 某 个 条 件 仍 然 为 真 ， 则 重复 执行 一 条 语句 或 一 组 语句 。 这 
样 的 例子 有 : 


只 要 有 票 可 卖 ， 就 继续 售票 。 
和 
当 有 票 可 以 卖 时 ， 保 持 售票 的 状态 。 
对 于 这 两 种 情况 ， 我 们 采用 下 列 统一 的 模式 作为 伪 代 码 : 
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while (条 件 ) : 
活动 
简 而 言 之 ， 这 个 语句 意味 着 检查 条 件 ， 如 果 为 真 ， 那 么 执行 活动 ， 然 后 返回 再 次 检查 条 件 。 但 
是 ， 如 果 发 现 条 件 为 假 ， 就 转移 到 while 结 构 后 的 下 一 个 指令 。 于 是 ， 前 面 的 两 个 语句 可 以 简 
化 为 
while ( 仍 有 票 可 卖 ) : 
卖 村 
在 许多 程序 设计 语言 中 ， 缩 进 通常 可 以 提高 程序 的 可 读 性 。 缩 进 在 Python 的 表示 法 中 是 必 
不 可 少 的， 在 我 们 所 用 的 由 Python 衍生 的 伪 代 码 中 也 同样 不 可 或 缺 。 例 如 ， 在 下 面 的 语句 中 : 
if (未 下 雨 ): 
if (温度 == 热 ) : 
去 游泳 
else: 


打 高 尔 夫 


else: 


看 电视 


缩 进 告诉 我 们 ， 除 非 条 件 为 “未 下 雨 ”， 否则 根本 不 会 问 “ 温 度 是 否 等 于 热 ”这 个 问题 。 注 意 双 
等 于 号 的 使 用 ， 要 将 “==” 与 赋值 运算 符 (=) 及 比较 运算 符 (==) 区 别 开 来 。 有 关 温 度 的 问 
题 是 财 套 (nested) 在 if 语句 内 部 的 ， 实 际 上 是 外 部 if 语句 条 件 为 真 时 才 会 执行 的 活动 。 同 样 ， 
缩 进 还 告诉 我 们 ,“else: 打 高 尔 夫 ” 属 于 内 部 i£ 语 句 ， 不 属于 外 部 if 语 句 。 因 此 ， 我 们 将 在 
伪 代 码 中 使 用 缩 进 。 

我 们 想 用 伪 代 码 来 描述 那些 可 在 其 他 应 用 中 用 作 抽 象 工具 的 活动 。 对 于 这 样 的 程序 单元 ， 
计算 机 科学 有 许多 术语 ， 如 子 程序 、 子 例 程 、 过 程 、 模 块 和 函数 ， 其 中 每 一 个 在 含义 上 都 有 自 
己 的 变化 。 对 于 伪 代 码 , 我 们 将 按照 Python 的 约定 , 在 我 们 的 伪 代 码 中 使 用 术语 函数 (function )， 
并 用 Python 关键 字 def 来 声称 标题 ， 伪 代码 单元 就 以 这 个 标题 命名 。 更 准确 地 说 ， 我 们 将 以 下 列 
形式 的 语句 开始 一 个 伪 代 码 单元 。 


def name () : 


其 中 ，name 是 该 单元 特有 的 名 字 。 在 这 个 引导 性 语句 的 后 面 是 一 系列 定义 该 单元 动作 的 语句 。 
例如 ,图 5-4 是 称 为 Greetings 的 函数 的 伪 代 码 表示 ， 
该 函数 打印 3 次 “Hello”。 

当 一 个 函数 所 实现 的 任务 在 伪 代 码 其 他 地 方 需 要 
时 ， 只 需要 通过 名 称 来 请 求 它 。 例 如 ， 如 果 有 取 名 为 
ProcessLoan 和 RejectApplication 的 两 个 函数 ， 
那么 可 以 通过 下 面 的 语句 在 ff else 结构 内 请 求 它 们 的 


def Greetings (): 


Count = 3 
while (Count > 0): 
print ('Hello') 


Count = Count -1 





服务 : 图 5-4” 伪 代 码 形式 的 函数 Greetings 
- 
ProcessLoan () 
else: 
RejectApplication() 


当 测 试 条 件 为 真 时 ,执行 函数 ProcessLoan; 在 条 件 为 假 时 ,执行 函数 RejectApplication。 
如 果 函 数 要 用 在 不 同 的 情况 下 ， 那 么 应 该 将 伪 代 码 设 计 得 尽 可 能 通用 。 一 个 给 名 字 列 表 排 
序 的 函数 应 该 设计 成 能 够 给 任何 列表 而 不 是 特定 的 列表 〉 排序， 因此 应 该 按照 这 样 的 要 求 来 
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编写 该 函数 : 不 在 函数 内 部 指定 要 排序 的 列表 。 事 实 上 ， 该 列表 应 在 这 个 函数 的 伪 代 码 里 以 类 
属 名 来 指称 。 

在 伪 代 码 里 ， 我 们 将 采用 这 样 的 约定 : 将 这 些 称 为 参数 (parameter) 的 类 属 名 列 在 括号 里 ， 
放 在 标识 函数 名 的 那 一 行 上 。 例 如 ， 一 个 名 为 Sort 的 函数 (设计 成 对 任何 名 字 列 表 进 行 排序 ) 
以 下 列 语句 开始 : 

def Sort (List): 
在 后 面 的 伪 代 码 里 ,在 需要 引用 要 排序 的 列表 时 ,就 可 以 使 用 类 属 名 List。 同 样 ， 当 需要 Sort 
服务 时 ， 我 们 将 知道 是 什么 列表 要 替代 函数 Sort 的 参数 List。 于 是 根据 需要 ， 可 以 写成 

Sort (组 织 的 成 员 列 表 ) 
和 

Sort (婚礼 宾客 列表 ) 














自然 语言 中 ， 项 (item ) 通常 使 用 多 单词 的 名 称 ， 如 “cost of producing a widget” 或 
“estimated arrival time”。 经验 表 明 ， 在 一 个 算法 表示 中 使 用 这 种 多 单词 的 名 称 会 使 算法 的 描述 复杂 
化 。 最 好 让 每 个 项 使 用 一 个 连续 的 文本 块 标识 。 多 年 来 , 许多 技术 被 用 于 将 多 单词 紧缩 为 单个 词法 
单元 ， 以 便 为 程序 中 的 项 提供 描述 性 的 名 称 ， 一 种 技术 是 使 用 下 划 线 来 连接 单词 ， 建 立 诸如 
estimated arrival time 这 样 的 名 称 。 另 一 种 技术 是 用 大 写字 母 帮助 读者 理解 紧缩 的 多 单词 名 
称 。 例 如 ， 我 们 可 以 对 每 个 单词 的 首 字 母 使 用 大 写 ， 获 得 诸如 EstimatedRArrivValTime 这 样 的 名 
称 。 这 种 技术 称 为 Pascal 大 小 写 (Pascal casing )， 因 为 该 样式 在 Pascal 程 序 设 计 语 言 的 用 户 中 很 
流行 。 一 种 Pascal 大 小 写 的 变形 称 为 驼峰 式 大 小 写 (camel casing )， 该 样式 除了 首 字母 小 写 外 ， 

其 他 与 Pascal 大 小 写 相 同 ， 如 estimatedArrivalTime。 本 书 中 ， 我们 使 用 Pascal 大 小 写 ， 但 
这 种 选择 很 大 程度 上 是 个 人 偏好 。 


问题 与 练习 


. 一 种 环境 下 的 原 语 可 以 是 另外 一 种 环境 下 的 原 语 的 组 合 。 比 如 , 我 们 的 while 语 句 是 我 们 伪 代 码 中 的 一 
个 原 语 ， 但 是 它 最 终 可 以 实现 为 机 器 语言 指令 的 组 合 。 给 出 非 计算 机 环境 下 的 这 种 现象 的 两 个 例子 。 
. 从 何 种 意义 上 讲 ， 函 数 的 结构 就 是 原 语 的 结构 ? 
. 欧 几 里 得 算法 给 出 了 求 两 个 正 整数 X 和 Y 的 最 大 公约 数 的 算法 ; 
只 要 X 和 Y 的 值 均 不 是 0， 就 用 较 大 的 数 除 以 较 小 的 数 ， 并 将 得 到 的 余数 赋 给 较 大 的 数 。 最 大 
公约 数 (如 果 存 在 ) 将 是 剩 下 非 零 值 。 
用 我 们 的 伪 代 码 表示 这 个 算法 。 
描述 一 个 在 计算 机 程序 设计 以 外 的 学 科 里 使 用 的 原 语 集合 。 


二 


LO iD 


5 


a 


程序 开发 由 两 个 活动 组 成 : 发 现 潜 在 的 算法 和 以 程序 的 方式 表示 算法 。 到 现在 为 止 ， 我 们 
一 直 在 关注 算法 表示 的 问题 ， 而 没有 考虑 算法 起 初 是 如 何 被 发 现 的 。 然 而 算法 的 发 现在 软件 开 
发 过 程 中 往往 是 更 加 具有 挑战 性 的 步骤 。 毕 竟 ， 发 现 一 个 解决 问题 的 算法 需要 找到 一 个 解决 该 
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问题 的 方法 。 因 此 ， 要 理解 算法 是 如 何 发 现 的 就 是 要 理解 问题 的 求解 过 程 。 
5.3.1 问题 求解 的 艺术 


问题 求解 的 技术 和 学 习 更 多 相关 知识 的 需求 并 不 只 存在 于 计算 机 科学 中 ， 这 是 一 个 几乎 在 
任何 领域 中 都 永久 存在 的 主题 。 算 法 发 现 的 过 程 和 一 般 问题 的 求解 过 程 之 间 的 密切 联系 ， 使 得 
计算 机 科学 进入 了 那些 试图 寻找 更 好 的 解决 问题 的 技术 的 学 科 中 。 最 终 ， 我 们 希望 可 以 把 问题 
的 求解 过 程 简化 为 一 个 算法 ， 但 是 这 已 被 证 明 是 不 可 能 的 。( 这 是 第 12 章 相关 内 容 的 结果 ， 在 第 
12 章 我 们 将 展示 有 些 问 题 是 找 不 到 算法 解决 方案 的 。) 因 此 问题 求解 能 力 更 多 地 成 为 一 种 有 待 开 
发 的 技艺 ， 而 非 需 要 学 习 的 精确 科学 。 

作为 问题 求解 难以 琢磨 、 颇 具 艺 术 性 的 本 质 的 证 据 ， 数 学 家 波 利 亚 〈G. Polya) 在 1945 年 列 
出 了 以 下 非 严 格 定义 的 问题 求解 阶段 ， 其 蕴涵 的 基本 原理 直至 今日 仍然 是 很 多 人 教授 问题 求解 
技能 的 基础 。 


第 1 阶段 ”理解 问题 。 

第 2 阶段 ”设计 一 个 解决 问题 的 计划 。 

第 3 阶段 ”完成 计划 。 

第 4 阶段 ”从 准确 度 及 其 是 和 否 有 潜力 作为 一 个 解决 其 他 问题 的 工具 这 两 方面 来 评估 这 个 计划 。 


我 们 把 上 述 阶段 移植 到 程序 开发 的 语 境 中 ， 这 些 阶段 变 成 : 


第 1 阶段 ”理解 问题 。 

第 2 阶段 ”得 到 一 个 算法 函数 如 何 求解 这 个 问题 的 思路 。 

第 3 阶段 ”系统 地 阐述 这 个 算法 并 用 程序 将 其 表达 出 来 。 

第 4 阶段 ”从 准确 度 及 其 是 和 否 有 潜力 作为 一 个 工具 解决 其 他 问题 这 两 方面 来 评估 这 个 程序 。 


在 描述 完 波 利 亚 的 观点 后 ， 我 们 要 着 重 强调 的 是 ， 这 些 阶段 并 不 是 在 尝试 求解 问题 的 时 候 
需要 遵循 的 步骤 ， 而 是 在 求解 过 程 中 有 时 需要 完成 的 阶段 。 这 里 的 关键 词 是 遵循 。 仅 遵循 这 些 
步骤 是 不 能 求解 问题 的 ， 要 求解 问题 ， 必 须 有 主动 开创 的 精神 。 如 果 在 求解 问题 的 时 候 总 是 抱 
有 “现在 我 完成 了 第 1 阶段 , 该 是 开始 第 2 阶段 的 时 候 了 ”之 类 的 想法 , 那么 你 可 能 根本 不 会 成 功 。 
然而 ， 如 果 你 仔细 考虑 问题 并 且 最 终 解决 了 它 ， 那 么 当 你 回 过 头 来 看 你 都 做 了 些 什么 的 时 候 ， 你 
很 可 能 会 发 现 ， 你 确实 经 历 了 波 利 亚 所 描述 的 各 个 阶段 。 

男 外 一 个 重要 观点 是 , 波 利 亚 所 描述 的 各 个 阶段 并 不 一 定 是 按 顺 序 完成 的 。 成 功 的 问题 
求解 者 通常 是 在 完全 理解 问题 本 身 ( 第 1 阶段 ) 之 前 就 开始 设计 构想 解决 这 个 问题 的 策略 (第 
2 阶段 )。 然 后 ， 如 果 他 们 的 策略 失败 了 《在 第 3 阶段 或 者 第 4 阶段 )， 他 们 会 对 这 个 问题 的 复 
杂 程 度 有 更 深 的 理解 。 基 于 这 些 比 较 深 入 的 理解 ,他 们 会 回 过 头 去 构想 其 他 更 有 希望 成 功 的 
策略 。 

必须 记 住 的 是 ， 我 们 正在 讨论 怎样 求解 问题 一 一 并 不 是 我 们 希望 问题 如 何 解决 。 在 理想 情 
况 下 ， 我 们 希望 消除 前 面 描述 的 “尝试 -错误 ”过 程 中 的 固有 的 浪费 。 在 开发 大 型 软件 系统 的 情 
况 下 ， 如 果 在 像 第 4 阶段 这 样 晚 的 时 候 才 发 现 问题 ， 那 么 就 会 导致 资源 的 极 大 浪费 。 避 免 这 样 的 
灾难 是 软件 工程 师 的 主要 目标 《第 7 音 )， 他 们 习惯 于 在 寻求 解决 方案 之 前 ， 坚 持 对 该 问题 有 一 
个 全 面 透 彻 的 理解 。 当 然 ， 有 些 人 可 能 会 说 ， 在 一 个 问题 解决 之 前 是 不 可 能 真正 理解 这 个 问题 
的 。 起 码 事实 上 ， 问 题 无 法 解决 表明 缺乏 对 问题 的 理解 。 因 此 ， 坚 持 在 提出 任何 解决 方案 之 前 
完全 理解 这 个 问题 的 想法 看 起 来 有 些 过 于 理想 化 。 

作为 一 个 例子 ， 我 们 考察 下 列 问题 : 
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甲 承担 了 确认 乙 的 3 个 孩子 的 年 龄 的 任务 。 乙 告诉 甲 3 个 孩子 的 年 龄 乘积 是 36。 在 
考虑 了 这 个 线索 以 后 ， 甲 要 求 乙 给 出 另外 的 线索 ， 于 是 乙 将 3 个 孩子 的 年 龄 之 和 告诉 了 
甲 。 甲 再 次 要 求 乙 给 出 其 他 线索 ， 于 是 乙 告 诉 甲 他 的 最 大 的 一 个 孩子 弹 钢琴 ， 在 得 到 
这 个 线索 之 后 ， 甲 将 3 个 孩子 的 年 龄 告诉 了 乙 。 

乙 的 3 个 孩子 的 年 龄 分 别 是 多 少 ? 


乍 一 看 ， 最 后 一 个 线索 似乎 与 该 问题 完全 没有 关系 ， 但 是 显然 ， 正 是 因为 这 条 线索 ， 甲 最 后 确定 
了 3 个 孩子 的 年 龄 。 这 是 为 什么 呢 ? 让 我 们 制订 一 个 解决 计划 并 且 遵 循 这 个 计划 ， 尽 管 我 们 对 于 
这 个 问题 还 有 很 多 疑问 。 我 们 的 计划 是 跟踪 问题 陈述 所 描述 的 步骤 ， 同 时 在 这 个 进程 中 记录 对 
甲 有 用 的 信息 。 

第 一 条 线索 告诉 甲 ，3 个 孩子 的 年 龄 之 积 是 36。 这 意味 着 表述 3 个 年 龄 数值 的 三 元 组 肯定 是 
图 5-5a 中 列 出 的 三 元 组 之 一 。 第 二 条 线索 是 期 望 的 三 元 组 内 3 个 数字 的 和 。 我 们 并 不 知道 这 个 和 
到 底 是 多 少 ， 但 是 知道 这 个 信息 并 不 足以 让 甲 得 到 正确 的 三 元 组 ， 所 以 期 望 的 三 元 组 肯定 是 其 
和 在 图 $-$b 中 的 表 里 面 至 少 出 现 两 次 的 那个 。 此 处 只 有 〈1 6, 6) 和 (2, 2, 9) 具有 相同 的 和 ， 
这 两 组 数字 的 和 均 是 13。 当 给 出 最 后 一 条 线索 的 时 候 , 我 们 最 终 理解 了 最 后 一 条 线索 的 重要 性 。 
这 个 信息 与 弹 钢 琴 本 身 没有 什么 关系 ， 而 是 说 明了 只 有 一 个 孩子 年 龄 最 大 的 事实 。 这 条 线索 将 
三 元 组 (1, 6, 6) 排除 并 且 最 终 得 到 结论 ， 就 是 3 个 孩子 的 年 龄 分 别 是 2、2 和 9。 


(1,1,36) (166) 1+1+36=38 1+6+6=13 
(1,2,18) (2,2,9) 1+2+18=21 2+2+9=13 
(1,3,12) (2,3,6) 1+3+12=16 2+3+6=11 
(1,4,9) (3,3,4) 1+4+9=14 3+3+4=10 


(a) 乘积 为 36 的 三 元 组 (b) (a) 中 每 个 三 元 组 的 和 





图 5-5 分析 可 能 性 


在 这 个 例子 中 ， 直 到 我 们 尝试 实施 解决 问题 的 计划 (第 3 阶段 ) 的 时 候 ， 才 获得 对 这 个 问题 
的 完全 理解 (第 1 阶段 )。 如 果 我 们 坚持 要 首先 完成 第 1 阶段 , 那么 可 能 根本 得 不 到 孩子 们 的 年 龄 。 
这 种 解决 问题 过 程 中 的 不 规则 性 是 开发 问题 求解 的 系统 方法 的 基础 。 

另外 一 个 不 规则 性 在 于 ， 那 些 对 一 个 问题 还 没有 取得 明显 成 功 的 问题 求解 者 ， 可 能 会 在 完 
成 其 他 任务 的 时 候 ， 突 然 发 现 原来 那个 问题 的 解决 方案 。 赫 尔 曼 。 冯 “。 雍 姆 霍 效 〈H, von 
Helmholtz) 早 在 1896 年 就 发 现 了 这 种 现象 ， 并 且 数 学 家 亭 利 。 庞 加 莱 〈Henri Poincaré) 在 巴黎 
对 心理 学 会 的 一 次 演讲 中 对 此 进行 了 讨论 。 在 这 个 演讲 中 ， 庞 加 莱 叙 述 了 他 获得 问题 解决 方 
案 的 经 历 : 他 将 原来 的 问题 放 在 一 边 儿 ， 开 始 做 其 他 工作 之 后 ， 却 突然 意识 到 原来 问题 的 一 
个 解决 方案 。 这 种 现象 反映 出 这 样 一 个 过 程 ， 大 脑 的 潜意识 部 分 好 像 一 直 在 思考 问题 ， 如 果 
成 功 ， 便 会 把 解决 方案 反映 给 大 脑 的 有 意识 部 分 。 今 天 ， 我 们 把 在 对 于 问题 的 有 意识 的 工作 
与 突然 的 灵感 之 间 的 这 个 时 期 称 作 沉思 期 (incubation period)， 对 于 这 个 时 期 的 理解 仍旧 是 当 
前 研究 的 目标 。 


5.3.2” 迈 出 第 一 步 


前 面 ， 我 们 已 经 从 一 些 心理 学 的 观点 讨论 了 问题 求解 ， 但 是 回避 了 直接 对 质 这 样 的 一 个 问 
题 ， 即 应 该 如 何尝 试 求解 问题 。 当 然 有 很 多 问题 求解 的 方法 ， 每 一 种 方法 都 可 能 在 茶 些 场合 获 
得 成 功 。 我 们 将 简要 地 介绍 其 中 一 些 方法 。 目 前 ， 我 们 注意 到 ， 这 些 技术 中 似乎 有 一 条 共同 的 
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主线 ， 简 单 地 说 就 是 要 “ 迈 出 第 一 步 ”。 作 为 一 个 例子 ， 让 我 们 考虑 下 面 这 个 简单 问题 。 
在 甲 、 乙 、 丙 和 丁 进行 赛跑 之 前 ， 他 们 分 别 对 结果 进行 了 预测 : 
甲 预 测 乙 将 会 获胜 . 
乙 预测 丁 将 是 最 后 一 名 。 
两 预测 甲 将 是 第 三 名 。 
丁 预 测 甲 的 预测 将 是 正确 的 。 

这 几 个 预测 只 有 一 个 是 正确 的 ， 并 且 是 最 后 的 获胜 者 作出 的 预测 ， 请 据 此 给 出 甲 、 乙 、 

两 、 丁 赛跑 的 名 次 排序 。 

在 读 了 这 个 问题 并 且 对 数据 进行 分 析 之 后 ， 我 们 很 快 就 可 以 认识 到 ， 因 为 甲 和 丁 的 预测 是 
相同 的 ， 而 只 有 一 个 人 的 预测 正确 ， 所 以 这 两 个 预测 都 是 错误 的 。 因 此 甲 和 丁 都 不 是 获胜 者 。 
在 这 一 点 上 我 们 已 经 为 解决 这 个 问题 迈 出 了 第 一 步 ， 并 且 发 现 获得 完整 的 解决 方法 的 过 程 仅仅 
是 以 此 为 基础 进一步 扩展 知识 。 如 果 甲 的 预测 错误 ， 那 么 乙 也 不 是 获胜 者 。 这 样 就 只 剩 下 了 一 
个 选择 ， 就 是 两 是 获胜 者 。 因 此 ， 丙 赢得 了 比赛 ， 并 且 丙 的 预测 是 正确 的 。 从 而 ， 我 们 知道 甲 
是 第 三 名 。 这 就 意味 着 最 后 的 比赛 名 次 是 两 、 乙 、 甲 、 丁 ， 或 者 两 、 丁 、 甲 、 乙 ， 但 是 前 者 被 
排除 了 ， 因 为 乙 的 预测 肯定 是 错误 的 。 因 此 最 后 的 顺序 是 : 两 、 丁 、 甲 、 乙 。 

当然 ， 知 道 怎样 迈 出 第 一 步 并 不 等 于 知道 如 何 去 做 这 件 事 。 得 到 立足 点 ， 并 认识 到 如 何 把 
对 于 问题 的 初始 介入 扩展 为 完整 的 问题 解决 方案 ， 需 要 问题 求解 者 进行 创造 。 对 于 如 何 迈 出 第 
一 步 ， 波 利 亚 和 其 他 人 提出 了 很 多 通用 的 方法 ， 其 中 一 个 是 反方 向 解决 问题 。 比 如 ， 如 果 问 题 
是 找到 对 于 一 个 已 知 输入 产生 一 个 特定 输出 的 方法 ， 我 们 可 以 从 输出 开始 ， 反 向 推导 出 输入 。 
这 个 方法 就 是 本 节 前 面 介绍 的 人 们 发 现 折 纸 鸟 算法 的 基本 思路 。 他 们 往往 是 拆 开 一 个 折 好 的 纸 
鸟 ， 看 看 它 是 怎么 折 好 的 。 

另 一 个 通用 的 解决 问题 的 方法 是 寻找 一 个 相关 的 、 解 决 起 来 较 简单 的 并 且 在 此 以 前 已 经 得 
到 解决 的 问题 ， 然 后 尝试 把 这 个 问题 的 解决 方案 用 到 当前 问题 中 。 这 个 技术 在 程序 开发 中 特别 
有 用 。 通 常 ， 程 序 开发 并 不 是 解决 一 个 问题 的 一 个 特定 实例 ， 而 是 要 寻找 一 种 适用 于 求解 一 个 
问题 的 所 有 实例 的 一 般 算法 。 更 准确 地 讲 ， 如 果 我 们 面 对 的 任务 是 开发 一 个 把 姓名 列表 按照 字 
母 顺序 排序 的 程序 ， 那 么 我 们 的 任务 并 不 是 只 给 一 个 特定 的 列表 排序 ， 而 是 寻找 一 个 可 以 用 来 
给 任何 名 称 列表 排序 的 通用 算法 。 因 此 ， 尽 管 指 令 

交换 名 字 David 和 Alice。 

将 名 字 Carol 移 到 Alice 和 David 之 间 。 

将 名 字 Bob 移 到 Alice 和 Carol 之 间 。 

可 以 把 由 David、Alice、Carol 和 Bob 组 成 的 列表 正确 排序 ， 但 这 并 不 是 我 们 需要 的 通用 算法 。 我 
们 需要 的 算法 应 当 既 可 以 对 这 个 列表 排序 ， 又 可 以 对 我 们 可 能 遇 到 的 其 他 列表 排序 。 这 并 不 是 
说 ， 为 特定 列表 排序 的 解决 方案 对 我 们 研究 通用 算法 完全 没有 意义 。 例 如 ， 我 们 可 以 通过 考虑 
特殊 情况 来 迈 出 第 一 步 ， 寻 求 能 够 用 于 开发 所 需 通 用 算法 的 一 般 原 则 。 于 是 ， 在 这 种 情况 下 ， 
我 们 可 以 从 解决 许多 相关 问题 的 技术 中 得 到 解决 方案 。 

另外 一 个 迈 出 第 一 步 的 方法 是 逐步 求 精 (stepwise refinement)， 这 种 方法 本 质 上 不 是 试图 立 
即 解决 整个 任务 〈 所 有 细节 ) 的 技术 。 相 反 ， 逐 步 求 精 建议 ， 首 先 把 一 个 手头 的 问题 看 作 多 个 
子 问题 。 思 路 是 ， 将 原 问 题 细 分 为 多 个 子 问 题 ， 通 过 逐步 解决 各 个 子 问题 来 得 出 原 问 题 的 整体 
解决 方案 ， 其 中 每 一 步 都 要 比 解 决 完整 的 原 问 题 更 容易 。 根 据 逐步 求 精 的 建议 ， 还 可 以 把 这 些 
步骤 分 解 成 更 小 的 步骤 ， 然 后 这 些 更 小 的 步骤 还 可 以 继续 分 解 ， 就 这 样 一 直 分 解 ， 直 到 整个 问 
题 被 简化 为 一 组 容易 解决 的 子 问 题 为 止 。 
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就 此 而 论 ， 逐 步 求 精 是 一 种 自 顶 向 下 方法 (top-down methodology)， 这 种 方法 从 一 般 发 展 
到 特殊 。 相 反 ， 自 底 向 上 方法 〈bottom-up methodology) 是 从 特殊 发 展 到 一 般 。 尽 管理 论 上 相 
反 ， 但 是 实际 上 这 两 种 方法 经 常 在 应 用 中 互 为 补充 。 对 逐步 求 精 的 自 顶 向 下 方法 提出 的 问题 的 
分 解 ， 通 常 要 以 那些 可 能 以 自 底 向 上 方式 工作 的 问题 求解 者 的 直觉 为 指导 。 

逐步 求 精 的 自 顶 向 下 方法 从 本 质 上 讲 是 一 种 组 织 工具 ， 这 种 工具 的 问题 求解 属性 是 组 织 方 
式 的 结果 。 逐 步 求 精 早已 成 为 数据 处 理 界 的 一 个 重要 的 设计 方法 ， 其 中 大 型 软件 系统 的 开发 都 
拥有 一 个 重要 的 组 织 模块 。 但 就 像 我 们 将 要 在 第 7 章 中 学 习 的 ,大 型 软件 系统 越 来 越 多 地 通过 组 
合 预制 构件 的 方式 来 构造 (本 质 上 是 一 种 自 底 向 上 的 方法 )。 因 此 ， 自 项 向 下 方法 和 自 底 向 上 方 
法 仍然 是 计算 机 科学 中 的 重要 工具 。 

维持 这 种 宽广 观点 的 重要 性 ， 是 通过 以 下 事实 例证 的 : 将 事先 形成 的 观念 和 预选 的 工具 
带 入 问题 求解 任务 ， 有 时 会 掩盖 问题 的 简单 性 。 本 节 前 面 讨论 的 求解 3 个 孩子 年 龄 的 问题 就 是 
这 种 现象 的 一 个 很 好 的 例子 。 学 习 代 数 的 学 生 会 不 约 而 同 地 用 联 立 方程 来 求解 这 个 问题 ， 这 
种 方法 可 能 会 将 问题 带 入 死路 ， 而 且 时 常会 使 问题 求解 者 误 认为 并 没有 足够 的 用 于 求解 问题 
的 信息 。 

下 面 是 男 外 一 个 例子 : 

当 你 从 码头 走 上 船 的 时 候 ， 你 的 帽子 掉 进 了 水 里 ， 但 是 你 并 不 知道 。 河 水 的 流速 

是 2.5 英 里 每 小 时 (1 英里 =1.6093 千 米 )， 所 以 你 的 帽子 开始 向 下 游 漂 去 。 同 时 ， 你 开始 

以 相对 于 水 流 4.75 英 里 每 小 时 的 速度 向 上 游 前 进 。10 分 钟 后 ， 你 发 现 幅 子 不 见 了 ， 然 

后 调转 船 头 ， 开 始 追 你 的 帽子 。 需 要 多 长 时 间 能 赶 上 你 的 帽子 ” 

大 多 数学 习 代 数 的 学 生还 有 那些 热衷 使 用 计算 器 的 人 在 解决 这 个 问题 的 时 候 ， 首 先 会 确定 
和 在 10 分 钟 后 向 上 游行 进 了 多 远 以 及 在 这 个 时 间 内 帽子 向 下 游 潭 了 多 远 。 然 后 ， 他 们 确定 船 向 
下 游行 驶 到 那个 位 置 需要 多 长 时 间 。 但 是 ， 当 船 到 达 这 个 位 置 的 时 候 ， 帽 子 又 向 下 游 漂 了 一 段 
距离 。 因 此 ， 问 题 求解 者 要 么 就 用 微 积 分 技术 重新 解 题 ， 要 么 就 陷入 到 计算 每 次 船 到 达 帽 子 的 
上 一 个 位 置 的 时 候 帽 子 所 处 的 位 置 这 样 一 个 怪圈 里 。 

然而 ， 这 个 问题 的 求解 实际 要 比 这 简单 得 多 。 诀 宅 在 于 抵制 这 种 一 开始 就 列 公 式 进行 计算 
的 冲动 。 其 实 ,我 们 需要 先 将 这 些 技巧 放 在 一 边 ， 调 整 我 们 的 思维 方式 。 整 个 问题 发 生 在 河中 。 
事实 是 水 相对 于 河岸 的 流动 与 解 题 是 不 相关 的 。 想 象 一 个 相同 的 问题 发 生 在 传送 带 上 而 非 水 中 。 
首先 ， 在 传送 带 停止 的 情况 下 解决 问题 。 如 果 你 站 在 传送 带 上 ， 然 后 把 帽子 放 在 脚 边 ， 之 后 反 
向 行走 10 分 钟 ， 那 么 返回 到 帽子 所 在 处 需 10 分 钟 。 现 在 启动 传送 带 ， 这 意味 着 旁边 的 场景 将 相 
对 于 传送 带 反 向 移动 ， 但 是 ， 因 为 你 站 在 传送 带 上 ， 所 以 这 不 会 改变 你 和 传送 带 或 者 帽子 之 间 
的 相对 关系 ， 因 此 你 返回 到 帽子 所 在 处 仍然 是 需要 10 分 钟 。 

我 们 得 到 的 结论 是 , 算法 的 发 现 仍旧 是 一 种 富有 挑战 的 艺术 ,必须 经 过 一 段 时 间 才 能 完成 ， 
而 不 能 像 一 门 由 明确 定义 的 方法 组 成 的 学 科 那 样 学 到 。 因 此 ， 训 练 潜在 的 问题 求解 者 使 之 遵循 
一 定 的 方法 ， 就 是 在 压制 那些 原本 就 有 的 创造 性 技能 。 


问题 与 练习 


1. a. 找到 一 个 求解 下 列 问题 的 算法 : 已 知 一 个 正 整数 m， 找 出 一 个 正 整数 列表 ， 该 列表 中 所 有 正 整数 的 
乘积 是 其 正 整 数 和 为 ?的 所 有 正 整 数列 表 中 最 大 的 。 例 如 ， 如 果 " 为 4， 那 么 所 求 的 列表 由 两 个 2 组 
成 ， 因 为 2Xx2 大 于 1X1X1X1、1X1X2 和 1X3。 如 果 n 为 5， 则 所 求 的 列表 由 2 和 3 组 成 。 
b. 如 果 n=2001， 那 么 所 求 的 列表 由 哪些 正 整 数组 成 ? 
c. 说 明 你 是 如 何 迈 出 第 一 步 的 。 
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2. a. 假设 已 知 方 格 棋盘 由 2" 行 2" 列 的 正方 形 组 成 的 ， 给 定 正 整 数 n7"， 以 及 一 盒 L 型 棋子 ， 每 一 个 都 恰好 
可 以 覆盖 棋盘 的 3 个 正方 形 格子 。 如 果 从 棋盘 上 切 掉 任 意 一 个 格子 , 我 们 是 否 还 可 以 用 这 些 棋子 在 
既 不 互相 重合 ， 又 不 跨越 棋盘 边缘 的 条 件 下 把 剩余 的 棋盘 填 满 ? 
b. 请 说 明 怎样 用 问题 的 解 来 证 明 : 对 于 所 有 的 正 整数 ?，2”-1 是 可 以 被 3 除 尽 的 。 
c. 说 明 问 题 a 和 问题 b 与 波 利 亚 的 问题 求解 阶段 的 关联 性 。 
3. 解码 下 面 的 消息 ， 然 后 说 明 你 是 如 何 迈 出 第 一 步 的 。 
Pdeo eo pda yknnayp wjosan. 
4. 如 果 你 打算 解决 拼图 游戏 问题 , 即 把 图 片 抛 散在 桌面 上 然后 试 着 将 它们 拼 在 一 起 , 你 会 采用 自 项 向 下 
方法 吗 ? 如 果 是 看 着 拼图 盒 上 的 完整 图 案 来 拼 ， 你 的 答案 会 改变 吗 ? 


5.4 和 迭代 结构 


我 们 现在 要 学 习 一 些 在 描述 算法 过 程 中 使 用 的 重复 结构 。 在 本 节 中 ， 我 们 讨论 迭代 结构 
(iterative structure)， 在 这 种 结构 中 ， 一 组 指令 以 循环 方式 重复 执行 。 在 下 一 节 中 ， 我 们 将 介绍 
递归 技术 。 我 们 将 附带 介绍 一 些 流 行 的 算法 : 顺序 搜索 算法 、 二 分 搜索 算法 和 插入 排序 算法 。 
首先 我 们 介绍 顺序 搜索 算法 。 


5.4.1 顺序 搜索 算法 


考虑 一 下 某 个 特定 目标 值 是 否 存在 于 一 个 列表 中 的 搜索 问题 。 我 们 希望 开发 一 个 算法 来 确定 
这 个 值 是 否 在 列表 中 。 如 果 它 在 列表 中 ， 我 们 认为 搜索 成 功 ; 和 否则 认为 搜索 失败 。 我 们 假设 该 列 
表 已 依照 某 种 规则 对 列表 条 目 做 了 排序 。 例 如 ， 如 果 这 是 一 个 姓名 列表 ， 我 们 就 假设 列表 中 的 名 
字 是 按照 字母 顺序 排列 的 ; 如 果 这 是 一 个 数字 列表 , 我 们 就 假设 它 里 面 的 条 目 是 按照 增 序 排列 的 。 

为 了 迈 出 第 一 步 , 我 们 想象 如 何在 一 个 大 概 有 20 条 记录 的 来 宾 列表 中 寻找 一 个 特定 的 姓名 。 
在 这 种 情况 中 ， 我 们 可 以 从 头 开 始 扫描 整个 列表 ， 将 每 一 个 条 目 与 目标 姓名 进行 比较 。 如 果 找 
到 了 目标 姓名 ， 则 搜索 以 成 功 告终 。 但 是 ， 如 果 搜 索 到 列表 的 末尾 没有 找到 目标 值 ， 则 搜索 以 
失败 告终 。 实 际 上 ， 如 果 到 达 了 〔 按 字母 顺序 ) 大 于 目标 姓名 的 姓名 还 没有 找到 目标 姓名 ， 我 
们 的 搜索 就 已 经 以 失败 告终 了 。( 记 住 , 列表 是 按照 字母 顺序 排列 的 ， 所 以 到 达 一 个 大 于 目标 姓 
名 的 姓名 就 意味 着 目标 姓名 没有 出 现在 列表 中 。) 概括 来 说 , 我 们 大 致 的 想法 就 是 ， 只 要 还 有 姓 
名 没 检 查 而 且 目标 姓名 大 于 正在 检查 的 姓名 ， 就 继续 搜索 。 

在 我 们 的 伪 代 码 中 ， 这 个 过 程 可 以 表达 为 : 

选择 List 中 的 第 一 个 条 目 作 为 TestEntry 

while (TargetValue > TestEntry and 还 有 条 目 ) : 

选择 List 中 的 下 一 个 条 目 作 为 TestEntry 

一 旦 这 个 while 结 构 终 止 ， 以 下 两 个 条 件 中 就 有 一 个 为 真 : 或 者 目标 值 被 找到 ， 或 者 目标 
值 不 在 列表 中 。 在 任何 一 种 情况 中 ， 我 们 都 可 以 通过 比较 测试 条 目 (TestEntry) 和 目标 值 
(TargetValue) 来 检测 搜索 是 否 成 功 。 如 果 这 两 个 值 相等 ， 搜 索 就 成 功 了 。 因 此 ， 我 们 把 下 
列 语句 添加 到 上 述 伪 代码 例 程 的 下 面 : 

if (TargetValue == TestEntry): 


声明 搜索 成 功 


else: 


声明 搜索 失败 
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最 后 ， 我 们 观察 这 个 例 程 的 第 一 条 语句 ， 这 条 语句 把 列表 中 的 第 一 个 条 目 选 做 测试 条 目 ， 
这 种 选择 的 前 提 是 假设 表 中 至 少 有 一 个 条 目 。 我 们 可 能 认为 这 是 一 种 安全 的 猜测 ， 但 是 为 了 保 
险 起 见 ， 我 们 将 前 面 的 例 程 作为 下 面 语句 中 的 else 部 分 : 
if (List 为 空 ) : 
声明 搜索 失败 。 


else: 


由 此 产生 的 函数 的 伪 代 码 如 图 5-6 所 示 。 注 意 ， 可 以 从 其 他 函数 内 部 使 用 这 个 函数 ， 如 利用 
语句 
用 函数 Search () 和 目标 值 Darrel Baker 搜 索 旅客 列表 
来 查 明 Darrel Baker 是 否 是 一 名 旅客 ， 用 语句 
用 函数 Search () 和 目标 值 nutmeg 搜 索 原料 列表 
来 查 明 nutmeg 〈 肉 豆 医 ) 是 否 出 现在 原料 列表 上 。 


def Search (List, TargetValue): 
if (List 为 空 ) : 
声明 搜索 失败 
else: 
选择 List 中 的 第 一 个 条 目 作 为 TestEntry 
while (TargetValue > TestEntry and 还 有 条 目 : ) 


选择 List 中 的 下 一 个 条 目 作 为 TestEntry 
if (TargetValue == TestEntry): 

声明 搜索 成 功 
else;s 


声明 搜索 失败 





图 5-6” 伪 代码 形式 的 顺序 搜索 算法 


概括 来 讲 ， 图 5-6 所 示 的 算法 是 按照 条 目 在 列表 中 出 现 的 顺序 进行 查找 的 。 由 于 这 个 原因 ， 
这 个 算法 被 称 作 顺 序 搜索 (sequential search) 算法 。 因 为 其 简单 ， 所 以 经 常用 于 短 列表 或 者 出 
于 其 他 考虑 需要 使 用 它 的 时 候 。 然 而 ， 对 于 长 列表 ， 顺 序 搜索 就 没有 我们 将 要 学 习 的 ) 其 他 
技术 高 效 了 。 


5.4.2 ”循环 控制 


一 条 指令 或 者 一 系列 指令 的 重复 使 用 是 一 个 重要 的 算法 概念 。 一 种 实现 这 种 重复 的 方法 是 
称 作 循环 (loop〉 的 迭代 结构 ， 这 种 结构 中 ， 一 组 称 为 循环 体 (body) 的 指令 在 某 个 控制 过 程 
的 指引 下 重复 执行 。 一 个 典型 的 例子 就 是 图 5-6 所 示 的 顺序 搜索 算法 。 这 里 我 们 使 用 while 语 句 
来 控制 下 面 这 条 语句 的 重复 : 

选择 List 中 的 下 一 个 条 目 作 为 TestEntry 


实际 上 ，while 语 句 
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while (条 件 ) : 
循环 体 
就 是 循环 结构 概念 的 一 个 例证 ， 因 为 它 的 执行 是 跟踪 循环 模式 
检查 条 件 
执行 循环 体 
检查 条 件 
执行 循环 体 
检查 条 件 


直到 条 件 为 假 。 

作为 一 般 规则 ， 循 环 结构 的 使 用 使 程序 得 到 了 比 仅仅 将 循环 体重 写 多 次 更 高 的 灵活 度 。 例 
如 ， 执 行 3 次 下 面 的 语句 : 

加 一 滴 硫 酸 
我 们 可 以 写 : 

加 一 滴 硫酸 

加 一 滴 硫 酸 

加 一 滴 硫 酸 
但 是 我 们 写 不 出 与 下 面 的 循环 结构 等 价 的 具有 相似 结构 的 序列 : 

while (pH 值 大 于 4): 

加 一 滴 硫 酸 

因为 我 们 事先 不 知道 需要 加 入 多 少 滴 硫酸 才 合适 。 

现在 让 我 们 仔细 看 看 循环 控制 的 组 成 。 你 可 能 认为 这 一 段 关于 循环 结构 的 部 分 并 不 重要 ， 
毕竟 ， 通 常 都 是 循环 体 在 实际 执行 手头 的 任务 〈 比 如 ， 加 几 滴 硫酸 ) 控制 活动 看 起 来 仅 是 
相关 的 开销 ， 因 为 我 们 选择 了 以 重复 的 方式 执行 循环 体 。 但 是 ， 经 验 表明 ， 循 环 控制 是 循环 结 
构 中 一 个 非常 容易 出 错 的 部 分 ， 所 以 很 值得 我 们 注意 。 

循环 控制 由 初始 化 、 测 试 和 修改 3 个 活动 〈 见 图 $-7) 组 成 ， 其 中 每 一 个 活动 都 决定 了 循环 
控制 是 否 能 够 成 功 。 测 试 活动 有 责任 通过 查看 表明 应 终止 的 条 件 来 终止 循环 过 程 。 这 个 条 件 就 
是 终止 条 件 (termination condition )。 为 了 这 个 测试 活动 ， 我 们 在 我 们 伪 代 码 的 每 一 个 while 语 
句 中 都 提供 了 一 个 条 件 。 然 而 ， 在 while 语 句 中 ， 规 定 的 条 件 是 循环 体 应 该 被 执行 的 条 件 一 一 终止 
条 件 就 是 while 结 构 中 出 现 的 条 件 的 对 立 条件 。 因 此 ， 在 下 面 的 语句 中 ， 终 止 条 件 是 “pH 值 不 
大 于 4” 

while (pH 值 大 于 4): 

加 一 滴 硫 酸 





设置 一 个 初始 状态 ， 这 一 状态 会 朝 着 终止 条 件 修改 
比较 当前 状态 和 终止 条 件 ， 如 果 相等 则 终止 重复 


: 改变 状态 使 之 移 向 终止 条 件 





图 5-7 重复 控制 的 组 成 
在 图 5-6 所 示 的 while 语 句 中 ， 终 止 条 件 可 规定 为 : 
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(TargetValue <= TestEntry) or (不 再 有 要 检查 的 条 目 ) 

循环 控制 中 的 另外 两 个 活动 确保 了 终止 条 件 最 终 可 以 出 现 。 初 始 化 步骤 建立 了 一 个 开始 条 
件 ， 修 改 步骤 将 这 个 条 件 移 向 终止 条 件 。 例 如 ， 在 图 5-6 中 ， 初 始 化 发 生 在 while 语 名 之 前 的 语 
名 中 ， 该 处 当前 的 测试 条 目 被 设 定 为 列表 的 第 一 个 条 目 。 在 这 个 例子 中 ， 修 改 步骤 实际 上 是 在 
循环 体内 完成 的 ， 在 循环 体 中 ， 我 们 将 测试 位 置 〈 也 就 是 测试 条 目 ) 移 向 了 列表 的 末尾 。 因 此 ， 
在 执行 完 初 始 化 步 又 后 ,修改 步骤 的 重复 应 用 最 终 使 得 程序 可 以 到 达 终 止 条 件 。( 或 者 到 达 一 个 
大 于 或 等 于 目标 值 的 测试 条 目 ， 或 者 最 终 到 达 列 表 的 末尾 。) 

我 们 应 该 强调 的 是 ， 初 始 化 步骤 和 修改 步骤 必须 导致 合适 的 终止 条 件 。 这 个 特性 对 于 正确 
的 循环 控制 至 关 重 要 ， 因 此 在 设计 循环 结构 的 时 候 必须 复核 它 是 否 存在 。 如 果 没 有 进行 这 样 的 
评估 ， 即 使 在 最 简单 的 例子 中 都 会 发 生 错误 。 一 个 典型 的 例子 就 是 

Number = 1 


while (Number != 6): 
Number = Number + 2 


注意 Python 运 算 符 “!=” 的 使 用 ， 它 读 作 “不 等 于 ”。 这 里 ， 终 止 条 件 是 “Number==6”。 但 是 
Number 的 值 被 初始 化 为 1， 然 后 在 修改 步 又 递增 2。 因 此 ， 在 循环 过 程 中 ，Number 的 值 将 是 1、 
3、5、7、9 等 ， 但 是 永远 不 会 是 6， 因 此 ， 循 环 将 无 法 终止。 
循环 控制 部 件 的 执行 次 序 可 产生 微妙 的 结果 。 事 实 上 ， 有 两 种 常用 的 循环 结构 ， 它 们 仅仅 
在 循环 控制 部 件 执行 次 序 上 有 所 区 别 。 第 一 种 的 例子 如 以 下 伪 代 码 语句 所 示 : 
while (条 件 ) : 
活动 
图 5-8 给 出 了 这 个 结构 的 语义 的 流程 图 (flowchart)。( 流 程 图 用 各 种 形状 来 表示 单个 步 又 ， 
用 第 头 表示 步骤 的 顺序 。 线 框 形状 之 间 的 不 同 表 示 相 关 步 又 涉及 的 动作 类 型 不 同 ， 比 如 菱形 
表示 判断 ， 而 矩形 表示 任意 语句 或 语句 序列 。) 注意 ，while 结 构 的 终止 测试 出 现在 循环 体 执行 
之 前 。 
相反 ， 图 5-9 中 所 示 的 结构 要 求 循环 体 在 终止 测试 完成 之 前 执行 。 在 这 种 情况 下 ， 循 环 体 总 
是 至 少 执行 一 次 ， 然 而 在 while 结 构 中 ， 如 果 终 止 条 件 在 第 一 次 测试 时 就 满足 ， 则 循环 体 一 次 
都 不 用 执行 。 
Python 没有 这 第 二 种 循环 的 内 置 结构 ， 虽 然 使 用 现 有 的 while 结 构 ， 再 加 一 个 话语 句 和 循环 体 
末尾 的 一 个 break， 就 能 很 容易 地 构建 一 个 等 效 的 结构 。 对 于 我 们 的 伪 代 码 ， 我 们 将 借用 几 种 
其 他 语言 中 已 有 的 关键 字 ， 使 用 语法 形式 
repeat : 
活动 
until (条 件 ) 
来 表示 图 5-9 所 示 的 结构 。 因 此 ， 语 句 
repeat: 
从 你 的 口袋 里 取出 一 枚 硬币 
until (你 的 口袋 里 没有 硬币 ) 
假设 开始 时 你 的 口袋 里 至 少 有 一 枚 硬币 ， 但 是 语 名 
while (你 的 口袋 里 有 一 枚 硬币 ) : 
从 你 的 口袋 里 取出 一 枚 硬币 


就 没有 做 这 个 假设 。 
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| 


站。 条 件 为 假 
pe “测试 条 件 “er 





条 件 为 





条 件 为 假 








| 和 EX 
图 5$-8 while 循环 结构 图 5$-9 ” repeat 循环 结构 


依照 我 们 伪 代 码 的 术语 ， 我 们 通常 会 把 这 些 循环 称 作 while 循 环 结构 或 者 repeat 循 环 结 
构 。 在 更 一 般 的 情况 下 ，while 循 环 结构 可 能 会 被 称 作 前 测试 循环 (pretest loop)( 因 为 终止 测 
试 是 在 循环 体 执行 之 前 进行 的 )， 而 repeat 循 环 结构 会 被 称 作 后 测试 循环 (posttest loop) (因为 
终止 测试 是 在 循环 体 执行 之 后 进行 的 )。 

虽然 许多 算法 要 求 在 控制 循环 时 慎重 考虑 初始 化 、 测 试 和 修改 活动 ， 但 其 他 一 些 算法 则 遵 
从 一 些 非常 常见 的 模式 。 特 别 是 在 处 理 数据 列表 时 ， 最 常见 的 模式 是 从 列表 中 的 第 一 个 元 素 开 
始 ， 考 虑 列表 中 的 每 一 个 元 素 ， 直 到 到 达 列 表 末 尾 。 暂 时 回 到 我 们 的 顺序 搜索 示例 上 ， 我 们 看 
到 这 个 模式 类 似 于 : 

选择 List 中 的 第 一 个 条 目 

while (还 有 条 目 ) : 


选择 List 中 的 下 一 个 条 目 
因为 这 个 结构 在 算法 中 出 现 得 如 此 频繁 ， 我 们 将 使 用 语法 形式 


for. Itéem 4n Llists: 


来 描述 一 个 迭代 遍历 列表 中 每 一 个 元 素 的 循环 。 注意， 这 个 伪 代 码 原 语 实际 上 是 比 while 结 构 
更 高 一 级 的 抽象 ， 因 为 我 们 可 以 用 单独 的 初始 化 、 修 改 和 测试 结构 实现 同样 的 效果 ， 但 是 这 个 
版 本 去 除了 不 必要 的 细节 ， 更 简洁 地 传达 了 这 个 循环 的 意思 。 

每 次 通过 这 个 for 循 环 结构 体 时 ， 值 Item 都 会 变 为 List 中 的 下 一 个 元 素 。 这 个 循环 的 
终止 条 件 在 到 达 List 末 尾 的 时 候 是 隐 含 的 。 作 为 一 个 例子 ， 要 想得到 列表 中 数字 的 总 和 ， 
可 以 使 用 : 

Sum = 0 

for Number in List: 

Sum = Sum + Number 


在 Python 以 外 的 语言 中 , 这 种 类 型 的 循环 通常 称 作 for-each 循 环 , 是 前 测试 循环 的 一 种 特例 。 


fo 结构 最 适合 的 情况 是 ， 算 法 对 列表 中 的 每 个 元 素 都 执行 同样 的 步 又， 不必 单独 跟踪 循环 计 
数 变量 。 
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5.4.3 ”插入 排序 算法 


作为 另外 一 个 使 用 欠 代 结构 的 例子 ， 下 面 考虑 将 一 个 名 字 列 表 按 照 字母 顺序 进行 排序 的 
问题 。 但 是 在 继续 介绍 之 前 ， 我 们 应 该 了 解 排 序 的 限制 。 简 单 来 讲 ， 我 们 的 目标 是 在 “列表 
自身 的 内 部 ”对 条 目 进行 排序 。 换 句 话 说 ， 我 们 想 通 过 把 条 目 移 来 移 去 来 对 列表 进行 排序 ， 
而 不 是 把 列表 移 到 其 他 位 置 。 我 们 的 情况 类 似 于 这 样 的 列表 排序 问题 : 每 个 条 目 记 录 在 一 张 
索引 卡片 上 ， 所 有 卡片 分 散在 桌面 上 ， 把 桌面 挤 得 满 满 的 ; 我们 已 经 清理 出 足够 的 空间 来 放 
这 些 卡 片 ， 但 是 不 允许 挪 开 其 他 东西 来 挤 出 更 多 的 空间 。 这 种 限制 在 计算 机 应 用 里 是 很 典型 
的 ， 其 原因 当然 不 是 机 器 里 的 工作 空间 一 定 像 桌面 那样 拥挤 ， 而 仅仅 是 因为 我 们 想 更 有 效 地 
利用 存储 空间 。 : 

下 面 我 们 来 迈 出 第 一 步 ， 考 虑 如 何在 桌面 上 对 名 字 进 行 排序 。 考 虑 一 个 名 字 列 表 : 

Fred 

Alex 

Diana 

Byron 

Carol 
对 这 个 列表 进行 排序 时 要 注意 的 是 ， 由 最 顶部 的 名 字 Fred 组 成 的 子 表 已 排序 ， 而 由 Fred 和 Alex 
这 两 个 顶部 名 字 组 成 的 子 表 还 没有 排序 。 因 此 ， 我 们 应 该 捡 起 含有 名 字 Alex 的 卡片 ， 将 Fred 问 
下 滑动 放 入 Alex 原 来 的 位 置 ,然后 把 Alex 放 入 Fred 原 来 的 位 置 ， 如 图 5-10 中 第 一 行 所 示 。 这 样 名 
字 列 表 就 变 成 了 : 

Alex 

Fred 

Diana 

Byron 

Carol 

现在 ， 顶 部 的 两 个 名 字 构 成 了 一 个 已 排序 的 子 列表 ， 但 是 最 顶部 的 3 个 名 字 还 不 是 。 因 
此 ， 我 们 应 该 捡 起 第 三 个 名 字 Diana， 将 Fred 问 下 滑动 放 入 Diana 原 来 的 位 置 ， 然 后 将 Diana 
放 入 Fred 原来 的 位 置 ， 如 图 5-10 中 第 二 行 所 示 。 现 在 最 顶部 3 个 条 目 都 已 排序 。 继 续 以 这 种 
方式 进行 操作 ， 通 过 捡 起 第 四 个 姓名 Byron， 将 Fred 和 Diana 向 下 滑动 ， 然 后 将 Byron 插 入 空 
缺 处 ， 就 能 够 获得 最 顶部 4 个 条 目 均 已 排序 的 列表 了 《 见 图 5-10 中 的 第 三 行 )。 最 后 ， 我 们 可 
以 通过 捡 起 Carol, 把 Fred 和 Diana 向 下 滑动 , 然后 把 Carol 放 入 空缺 来 完成 排序 过 程 ( 见 图 5$-10 
中 的 第 四 行 )。 

在 分 析 了 一 个 特定 列表 的 排序 过 程 之 后 ， 现 在 的 任务 是 将 这 个 过 程 一 般 化 ， 得 到 一 个 对 一 
般 列 表 进行 排序 的 算法 。 为 此 ， 我 们 观察 图 5-10， 发 现 其 每 一 行 都 代表 着 一 个 同样 的 一 般 过 程 : 
捡 起 列表 中 还 未 排序 的 部 分 中 的 第 一 个 名 字 ， 将 已 排序 的 部 分 中 大 于 此 名 字 的 条 目 向 下 滑动 ， 
然后 将 这 个 取出 的 名 字 插 入 到 这 一 部 分 的 空缺 处 。 如 果 把 取出 的 名 字 称 为 主 元， 那么 这 个 过 程 
可 以 用 下 面 的 伪 代 码 表示 : 

把 主 元 移 到 一 个 临时 位 置 使 该 Dist 留 出 一 个 空缺 

while (在 空缺 位 置 的 上 面 有 名 字 and 这 个 名 字 比 主 元 大 ) : 


将 空缺 上 面 的 名 字 下 移 到 空缺 上 使 该 名 字 上 面 留 出 一 个 空缺 
将 主 元 移 到 List 中 的 空 扎 上 
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初始 列表 [IE 








| Alex | [Carol 
















的 结构 (谱写 成 多 个 小 节 ， 每 个 小 节 配 以 和 有 
while (有 剩余 小 节 ) : ， 1 


唱 下 一 小 节 
， ”唱和 声 
此 外 ， 乐 谱 


只 不 过 是 谱 曲 者 表达 下 面 结构 的 方式 : 
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A 
while (N < 3): 
演奏 该 乐曲 段 
演奏 第 N 段 尾 曲 
RN 


接 下 来 ， 我 们 来 观察 这 个 过 程 应 该 怎样 重复 执行 。 为 了 开始 这 个 排序 过 程 ， 主 元 应 该 是 列 
表 的 第 二 个 条 目 ， 然 后 ， 每 当 再 次 执行 前 ， 主 元 的 选择 都 应 该 是 沿 着 列表 向 下 的 下 一 个 条 目 直 
到 列表 的 最 后 一 个 条 目 已 被 定位 。 也 就 是 说 ， 随 着 前 面 例 程 的 重复 ， 主 元 的 位 置 从 第 二 个 条 目 
移 进 到 第 三 个 条 目 ， 然 后 到 第 四 个 条 目 ， 依 次 类 推 ， 直 到 程序 定位 到 列表 的 最 后 一 个 条 目 。 根 
据 这 个 思路 ， 我 们 可 以 使 用 下 面 的 语句 控制 这 个 所 需 的 重复 : 

N=2 

while (N 的 值 没 有 超过 Li st 的 长 度 ) : 

选择 List 中 的 第 N 个 条 目 作 为 主 元 


NE NW 

这 里 ，N 表 示 主 元 的 位 置 ，List 的 长 度 是 指 列表 中 的 条 目 个 数 ， 而 省 略 号 则 是 指 放置 前 面 例 程 
的 位 置 。 

完整 的 伪 代 码 程序 如 图 $-11 所 示 。 简 言 之 ， 这 个 程序 是 通过 重复 地 移动 条 目 并 且 将 其 插入 
适当 的 位 置 来 完成 排序 的 。 由 于 这 种 重复 的 插入 过 程 ， 这 种 算法 称 为 插入 排序 (insertion sort)。 

注意 ， 图 5-11 中 所 示 的 结构 是 一 个 循环 内 部 还 有 循环 的 结构 ， 外 层 循环 用 第 一 个 while 语 句 
表述 ， 而 内 层 循环 用 第 二 个 while 语 句 表述 。 每 次 执行 外 层 循 环 体 都 导致 内 层 循环 体 被 初始 化 而 
且 重复 执行 直到 达到 终止 条 件 ， 因 此 ， 外 层 循环 体 的 一 次 执行 将 导致 内 层 循 环 体 多 次 执行 。 


def Sort (TAst}a 


N=2 
while (N 的 值 没有 超过 List 的 长 度 ) : 
选择 List 中 第 N 个 条 目 作 为 主 元 
把 主 元 移 到 一 个 临时 位 置 使 该 Zist 留 出 一 个 空缺 


while (在 空缺 位 置 的 上 面 有 名 字 and 这 个 名 字 比 主 元 大 ) : 
将 空缺 上 面 的 名 字 下 移 到 空缺 上 使 该 名 字 上 面 留 出 一 个 空缺 

将 主 元 移 到 List 中 的 空缺 上 

NN 





图 5-11 用 伪 代 码 表达 的 插入 排序 算法 
外 层 循环 控制 的 初始 化 部 分 由 建立 N 的 初始 值 的 语句 


N = 2 
组 成 。 修 改 部 分 通过 下 列 语句 每 次 给 循环 体 末 尾 的 N 加 1 完成 : 
N=N+1 


当 N 的 值 超过 列表 的 长 度 时 ， 终 止 条 件 出 现 。 

内 层 循环 控制 通过 移动 主 元 创建 一 个 空缺 位 置 来 初始 化 。 循 环 的 修改 步 又 通过 移动 条 目 到 
空缺 位 置 来 实现 ， 因 此 导致 空缺 位 置 上 移 。 终 止 条件 有 两 个 ， 或 者 空缺 位 置 上 方 紧 临 的 名 字 不 
大 于 主 元 ， 或 者 空缺 位 置 到 达 列 表 顶 部 。 
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问题 与 练习 


iD C5 一 


Ly 


上 


GN nn 


一 


5.5 递归 结构 


. 修改 图 5-6 中 的 顺序 搜索 函数 ， 使 其 可 用 于 未 排序 的 列表 。 


把 下 面 的 伪 代 码 转换 为 等 价 的 用 repeat 语 句 表述 的 程序 。 


2=0 

WR = 

whvisbe V(X SEO 
2 三 六 二 这 
X= XH 


. 当今 一 些 流行 的 程序 设计 语言 使 用 语法 


Waist Adon i rh) 
来 表示 前 测试 循环 ， 而 用 语法 
ee 


来 表示 后 测试 循环 。 尽 管 设 计 上 显得 很 优雅 ， 但 是 这 种 相似 的 形式 会 导致 什么 问题 ? 


. 假设 应 用 图 5-11 所 示 的 插入 排序 算法 来 对 列表 Gene、Cheryl、Alice 和 Brenda 进 行 排序 。 描 述 外 层 while 


结构 的 循环 体 每 次 执行 结束 时 列表 的 构成 。 


. 为 什么 不 能 把 图 5-11 中 while 语 名 内 的 “大 于 ” 改 为 “大 于 或 等 于 ”? 
. 插入 排序 算法 的 一 个 变种 是 选择 排序 (selection sort)。 此 排序 算法 从 选择 列表 中 最 小 的 条 目 并 将 其 


移 至 列表 的 最 前 面 开始 ， 然 后 选择 列表 中 剩余 的 条 目 中 最 小 的 条 目 ， 并 将 其 放 到 表 的 第 二 个 位 置 。 
通过 重复 从 列表 的 剩余 部 分 中 选择 并 前 移 最 小 的 条 目 ， 列 表 的 已 排序 部 分 便 从 前 向 后 逐渐 变 长 ， 而 
后 面 未 排序 的 部 分 逐渐 缩短 。 使 用 我 们 的 伪 代 码 和 选择 排序 算法 来 表达 一 个 类 似 于 图 5-11 中 的 列表 
排序 函数 的 函数 。 


. 田 一 个 著名 的 排序 算法 是 冒 泡 排序 (bubble sort)。 这 个 算法 是 重复 对 列表 中 相 邻 的 两 个 条 目 进行 比 较 ， 


如 果 它 们 并 不 是 依照 规定 排序 的 ， 就 交换 它们 的 位 置 。 我 们 假设 等 待 排序 的 列表 有 za 个 条 目 。 冒 泡 排 
序 将 从 比较 并 可 能 交换 位 置 x 和 n-1 上 的 条 目 开 始 。 然后 ， 它 将 考虑 位 置 n-1 和 n-2 上 的 条 目 ， 并 
且 继 续 向 列表 的 前 面 移动 , 直到 列表 的 第 一 个 条 目 和 第 二 个 条 目 己 被 比较 〈 并 可 能 交换 )。 可 以 看 出 ， 
通过 一 遍 排序 ， 最 小 的 条 目 将 被 移 到 列表 的 最 前 面 。 同 理 ， 再 一 遍 排序 将 把 仅 大 于 最 小 条 目的 条 目 放 
到 列表 的 第 二 个 位 置 。 因 此 ， 重 复 呈 1 遍 后 就 完成 了 整个 列表 的 排序 。( 如 果 我 们 观察 算法 的 工作 过 
程 ， 那 么 就 会 看 到 小 条 目 像 气泡 一 样 冒 到 了 列表 的 前 面 一 一 这 个 算法 因此 得 名 。) 请 使 用 我 们 的 伪 代 
码 和 冒 泡 排序 算法 来 表达 一 个 类 似 于 图 5-11 中 的 列表 排序 函数 的 函数 。 





递归 结构 为 实现 重复 活动 提供 了 除 循环 模型 以 外 的 另外 一 种 选择 。 循 环 涉及 重复 一 个 指令 


集 ， 其 方式 是 执行 完成 一 组 指令 ， 然 后 重复 执行 ， 而 递归 则 是 通过 将 指令 集 作为 自身 的 一 个 子 
任务 重复 调用 来 运行 。 打 个 比方 ， 考 虑 处 理 具有 呼叫 等 待 功能 的 电话 通话 的 过 程 。 在 这 个 例子 
中 ， 当 处 理 另外 一 个 来 电 的 时 候 ， 先 前 未 完成 的 通话 将 被 搁置 一 边 ， 结 果 是 ， 一 共 进行 了 两 次 
通话 。 然 而 ， 这 两 次 通话 并 不 是 像 循环 结构 那样 一 个 接 一 个 地 进行 的 ， 而 是 一 次 通话 在 另外 一 
次 通话 过 程 中 进行 。 


5.5.1 二 分 搜索 算法 


作为 一 种 介绍 递归 的 方法 ， 让 我 们 再 次 处 理 在 一 个 已 排序 的 列表 中 搜索 是 否 存在 某 特 定 条 
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目的 问题 ， 但 是 这 次 将 通过 考虑 查 字典 的 步骤 来 近 出 第 一 步 。 在 这 个 例子 中 ， 我 们 不 再 按照 一 
个 条 目 一 个 条 目 或 者 是 一 页 -页 的 步 又 进行 ， 而 是 通过 直接 翻 到 我 们 认为 目标 可 能 存在 的 那 一 
页 开始 查找 ， 如 果 幸 运 的 话 ， 我 们 将 在 那里 找到 目标 值 ， 否 则 ， 就 必须 继续 查找 。 但 至 少 我 们 
已 经 大 大 缩小 了 查找 的 范围 。 

当然 , 在 查 字典 的 时 候 , 我 们 有 知道 可 能 在 哪儿 能 查 到 单词 的 先 验 知识 。 例 如, 查 somnambulism 
这 个 单词 ， 我 们 就 会 从 字典 的 后 面部 分 开始 查找 。 但 是 对 于 一 般 列表 ， 我 们 并 没有 这 种 先 验 知 
识 ， 所 以 我 们 总 是 假定 从 列表 的 “中 间 ” 条 目 开 始 搜索 。 这 里 “中 间 ” 这 个 词 之 所 以 用 引号 引 
起 来 ， 是 因为 一 个 列表 可 能 包含 偶数 个 条 目 ， 这 种 列表 就 没有 准确 意义 上 的 中 间 条 目 。 在 这 种 
情况 下 ， 我 们 将 假定 该 “中 间 ” 条 目 为 该 列表 中 后 半 部 分 的 第 一 个 条 目 。 

如 果 列表 的 中 间 条 目 就 是 目标 值 ， 我 们 就 可 以 声明 搜 过 成功， 否则， 我 们 至 少 可 以 将 搜索 
过 程 限定 在 列表 的 前 半 部 分 或 者 后 半 部 分 ， 具 体 要 依赖 于 目标 值 是 小 于 还 是 大 于 我 们 所 考虑 的 
中 间 条 目 。( 记 住 ， 列 表 是 已 排序 的 。) 

在 列表 的 剩余 部 分 搜索 ， 我 们 可 以 应 用 顺序 搜索 ， 但 这 里 仍然 应 用 在 完整 列表 中 所 使 用 的 
方法 。 也 就 是 说 ， 我 们 选择 列表 剩余 部 分 的 中 间 条 目 作为 下 一 个 要 考虑 的 条 目 。 像 刚才 那样 
如 果 这 个 条 目 就 是 目标 值 ， 那 么 搜索 结束 :否则 ， 可 以 把 搜索 限定 在 更 小 的 列表 部 分 中 。 

图 5-12 简 要 概括 了 这 个 搜索 方法 ， 这 里 我 们 要 考虑 的 任务 是 搜索 图 左边 列表 中 的 John 条 目 。 
首先 考虑 中 间 条 目 Harry。 因 为 我 们 的 目标 在 此 条 
目 后 面 的 列表 中 ， 所 以 接 下 来 的 搜索 将 考虑 原始 “国生 全 
列表 的 下 半 部 分 。 该 子 表 的 中 间 条 目 是 Lary。 因 “AL 


Bob 
为 我 们 的 目标 应 该 在 Larry 之 前 ， 所 以 我 们 的 注意 pk 


力 将 转 到 当前 子 表 的 前 半 部 分 。 查 看 第 二 个 子 表 Ea 
的 中 间 条 目 时 ， 我 们 找到 了 目标 条 目 John， 并 声 es 
明 搜 索 成 功 。 简 言 之 ， 我 们 的 策略 就 是 ， 将 所 讨 Harry 


lrene Irene Irene 
论 的 列表 连续 地 分 成 更 小 的 段 ， 直 到 最 终 找到 目 “yehn | Yehn > i 
标 或 者 发 现 搜索 被 限制 在 一 个 空 段 中 。 Lary | mp tar 
这 里 需要 强调 这 最 后 一 点 。 如 果 目 标 值 不 在 。 “New Nooey > 


原始 列表 中 ， 那 么 我 们 的 搜索 方法 会 将 列表 不 断 Oliver Oliver | 
pe 所 考 访 的 自 为 空 此 时 ， 算 法 图 5-12 ”应 用 我 们 的 策略 在 列表 中 搜索 John 条 目 
图 5-13 就 是 整个 算法 的 第 一 个 伪 代 码 草 稿 。 这 个 草稿 引导 我 们 通过 测试 表 是 否 为 空 来 开始 


if (List 为 空 ) : 
报告 搜索 失败 

else: 
TestEntry = List 的 “中 间 ” 条 日 
if (TargetValue == TestEntry): 


报告 搜索 成 功 
if (TargetValue < TestEntry): 

用 函数 Search () 在 TestEntry 前 面 的 List 部 分 里 搜索 TargetValue， 并 报告 搜索 结果 
if (TargetValue > TestEntry) : 

用 函数 Search () 在 TestEntry 后 面 的 List 部 分 里 搜索 TargetValue， 并 报告 搜索 结果 





图 5-13 二 分 搜索 技术 的 第 一 个 草稿 
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搜索 过 程 。 如 果 为 空 ， 我 们 会 被 告知 搜索 失败 ; 和 否则， 我 们 会 被 告知 要 考虑 列表 的 中 间 条 目 。 
如 果 此 条 目 不 是 目标 值 ， 我 们 就 会 被 告知 要 搜索 表 的 前 半 部 分 或 者 后 半 部 分 。 这 两 种 可 能 都 需 
要 第 二 次 搜索 。 通 过 调用 一 个 抽象 工具 的 服务 来 执行 这 些 搜索 会 很 方便 。 尤 其 是 ， 我 们 的 方法 
是 应 用 一 个 称 作 Search 的 函数 来 执行 第 二 次 搜索 。 因 此 ， 为 了 完成 我 们 的 程序 ， 必 须 提供 这 样 
一 个 函数 。 

但 是 这 个 函数 应 该 执行 相同 的 任务 ， 而 这 个 任务 已 经 由 前 面 所 给 出 的 伪 代 码 表 达 。 它 应 该 
先 检查 给 定 列表 是 否 为 空 ， 如 果 非 空 ， 它 应 该 继续 考虑 此 表 的 中 间 条 目 。 因 此 我 们 可 以 提供 一 
个 函数 ， 只 需 把 当前 例 程 视 为 Search 函 数 ， 并 在 第 二 次 查找 的 地 方 插入 对 这 个 函数 的 引用 。 结 
果 如 图 5-14 所 示 。 

注意 ， 这 个 函数 包含 了 一 个 对 自身 的 引用 。 当 然 ， 如 果 遵 循 这 个 函数 ， 然 后 到 达 指 令 


Searcehm(s  。 。 小 


我 们 将 把 同样 的 函数 应 用 到 一 个 较 小 的 表 上 ， 而 这 正 是 应 用 于 原始 列表 的 那个 函数 。 如 果 首 次 
搜索 成 功 ， 我 们 将 返回 并 声明 我 们 的 初始 搜索 成 功 ， 如 果 第 二 次 搜索 失败 ， 我 们 将 声明 我 们 的 
初始 搜索 失败 。 


def Search (List, TargetValue): 
if (List 为 空 ) : 
报告 搜索 失败 
else: 
TestEntry = List 的 “中 间 ” 条 目 
if (TargetValue == TestEntry): 


报告 搜索 成 功 


if (TargetValue < TestEntry): 
Sublist = TestEntry 前 面 的 List 部 分 
Search(Sublist, TargetValue) 

if (TargetValue > TestEntry): 
Sublist = TestEntry 后 面 的 List 部 分 
Search (Sublist, TargetValue) 





图 5-14 ”二 分 搜索 算法 的 伪 代 码 





为 了 看 看 图 5-14 中 的 函数 是 如 何 执行 其 任务 的 ， 我 们 让 它 搜索 一 个 包括 Alice、Bill、Carol、 
David、Evelyn、Fred 和 George 的 列表 ， 查 找 目 标 值 Bill, 看 看 它 的 执行 过 程 。 首 先 选 择 David (中 
间 条 目 ) 作为 考虑 的 测试 条 目 。 因 为 目标 值 (Bil) 小 于 该 测试 条 目 ， 我 们 将 对 David 之 前 的 列 
表 条 目 〈 即 列表 Alice、Bill 和 Carol) 调用 Search 函 数 。 这 样 我 们 便 创建 了 搜索 函数 的 第 二 个 副 
本 ， 并 将 它 用 于 第 二 次 任务 。 
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现在 我 们 拥有 两 个 正在 执行 的 搜索 函数 的 副本 ， 如 图 5-15 所 示 。 先 前 的 原始 副本 在 执行 


Search (Sublist，TargetValue) 


我 们 在 这 时 
DFT Search (List，TargetValue) 1 Search (List, TargetValue) 
FE (List 1s empt, ty) st a ty 
Febert that the search failed. i that Eo search failed. 
i i 
Testentry > = the "middle”" entry in List 2 TestEntry = the We entry in List 
Pe == TestEntry): < > 抽 % 人 == TestEntry: 
t that the search lc eeeded, t 哺 刘 rt that the th succeeded. 
it rt < TestEntry) - ‘AL 1 ee < TestEntry. 
Sublist = es of List preceding 加 A 2 of List preceding 
Tes -” Tes: 
cdr ch tai LE TargetValue) Ged he TargetValue) 
IT CTargetValue > TestEntry) Ee if (TargetValve > TestEntry) 
bl ke 人 of List following , SE bio of List following 
Tes | Tes 
areh6Subi TargetValue) a ne TargetValue) 
List List 





图 5$-15 ”递归 搜索 


指令 时 被 临时 挂 起 ， 此 时 我 们 应 用 第 二 个 副本 完成 对 列表 Alice、Bil 和 Carol 的 搜索 任务 。 完 成 
第 二 次 搜索 后 ， 我 们 将 放弃 该 函数 的 第 二 个 副本 ， 并 将 它 找到 的 结果 通知 给 原始 副本 ， 然 后 继 
续 执 行 原始 的 函数 。 通 过 这 种 方式 ， 函 数 的 第 二 个 副本 被 当 作 原始 函数 的 子 函数 运行 ， 完 成 由 
原始 模块 请 求 的 任务 ， 然 后 消失 。 

第 二 次 搜索 中 ，Bill 被 选 作 测试 条 目 ， 这 是 因为 它 是 表 Alice、B 志 和 Carol 的 中 间 条 目 。 由 于 
这 一 条 目 与 目标 值 相同 ， 所 以 函数 声明 整个 搜索 成 功 并 终止 。 

此 时 ， 我 们 已 经 完成 了 函数 的 原始 副本 所 请 求 的 第 二 次 搜索 ， 所 以 可 以 继续 原始 副本 的 执 
行 。 这 里 ， 我 们 又 被 告知 应 该 把 第 二 次 搜索 的 结果 作为 原始 搜索 的 结果 报告 。 因 此 ， 我 们 报告 
原始 搜索 已 经 成 功 。 我们 的 搜索 已 正确 确定 ，Bill 是 表 Alice、Bill、Carol、David、Evelyn、Fred 
和 George 中 的 成 员 。 

现在 让 我 们 考虑 一 下 ， 如 果 用 图 5-14 所 示 的 函数 在 表 Alice、Carol、Evelyn、Fred 和 George 
中 搜索 David， 会 出 现 什 么 情况 。 这 次 函数 的 原始 副本 选择 Evelyn 为 测试 条 目 ， 并 推断 目标 肯定 
存在 于 表 的 前 半 部 分 。 因 此 它 请 求 函 数 的 另外 一 个 副本 来 搜索 Evelyn 之 前 的 条 目 一 一 即 包含 
es 二 在 此 阶段 ， 我 们 遇 到 了 图 5-16 所 示 的 情况 。 

函数 的 第 二 个 副本 选择 Carol 当 作 当 前 条 目 ， 同 时 推断 目标 值 必定 存在 于 该 列表 的 后 半 部 
分 。 然 后 ， tie 个 如 sn i le 组 成 的 
列表 。 该 子 表 为 空 ， 所 以 函数 的 第 三 个 副本 需要 在 一 个 空 表 中 搜索 目标 值 David。 图 5-17 显 示 了 
目前 所 处 的 情况 。 函 数 的 原始 副本 负责 处 理 表 Alice、 ed Evelyn、Fred 和 George 的 搜索 任务 ， 
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测试 条 目 为 Evelyn; 第 二 个 副本 负责 处 理 表 Alice 和 Carol 的 搜索 ， 测 试 条 目 为 Carol; 第 三 个 副本 
要 在 一 个 空 表 中 开始 搜索 。 


A 












| sarch Ce, TargetValue) 
> (List is empty) 
pre iE that the search failed, 


"search (List, TargetValue) 
If (List is empty) 
A that the search failed. 


TestEntry = the "middle" entry in List 
(TargetValue == TestEntry) , 
Report that the search succeeded, 
1 (TargetValue < TestEntry) 
Sublist = portion of List 0 
TestEntry 
SearchCSsub1ist， TargetValue) 
1T (TargetValue > TestEntry) 
a 人 of List following 
Tes 
se ho TargetValue) 


ss = the "middle” neh sn vist 站 
| CargetValue == TestEntry) dy 
Report that the search succeeded. 
| (TargetValue < TestEntry) ， 了 
Sublist = portion of List preceding | 
TestEntry 0 
Sear chesuty ist, TargetValue) 
CTargetValue > TestEntry)- | | 
人 = i of List Hollowing 


Tes 
， Cs， Targetvalue) 





‘ Us 


图 5-16 ”第 二 次 递归 搜索 ， 第 一 个 快照 


当然 ， 函 数 的 第 三 个 副本 很 快 就 会 声明 它 的 搜索 失败 并 终止 。 第 三 个 副本 的 任务 的 完成 使 
得 第 二 个 副本 能 够 继续 执行 。 第 二 个 副本 注意 到 它 请 求 的 搜索 未 成 功 ， 于 是 声明 自己 的 搜索 失 
败 并 终止 。 这 个 报告 是 原始 副本 一 直 在 等 待 的 ， 所 以 它 现 在 可 以 继续 执行 了 。 因 为 它 所 请 求 的 
搜索 失败 ， 因 此 它 声明 自己 的 搜索 已 失败 并 终止 。 我 们 的 例 程 正 确 地 推断 出 David 不 在 Alice、 
Carol、Evelyn、Fred 和 George 组 成 的 列表 中 。 

综 上 所 述 ， 如 果 回 顾 前 面 的 例子 ， 我 们 就 能 够 看 到 ， 图 5-14 所 示 的 算法 要 重复 地 将 所 考虑 
的 列表 分 成 两 个 较 小 的 块 ， 以 这 种 方式 将 后 续 的 搜索 严格 地 限制 在 其 中 一 个 块 中 。 这 种 一 分 为 
二 的 方法 就 是 该 算法 称 为 二 分 搜索 (binary search) 的 原因 。 


5.5.2 ”递归 控制 


二 分 搜索 算法 与 顺序 搜索 相似 ， 因 为 它们 都 需要 执行 一 个 重复 的 过 程 。 但 是 ， 这 种 重复 的 
实现 却 是 截然 不 同 的 。 顺 序 搜索 是 以 一 种 循环 的 方式 重复 执行 一 个 过 程 ， 而 二 分 搜索 则 是 把 每 
一 阶段 的 重复 当 作 前 一 阶段 的 子 任务 。 该 技术 称 作 递归 (recursion)。 

正如 我 们 所 匈 ， 北 归 函数 产生 的 幻象 是 这 个 函数 存在 多 个 副本 ， 每 个 副本 称 作 这 个 函数 的 
一 个 活动 (activation)。 这 些 活动 通过 一 种 棋 父 万 式 动态 创建 ， 并 随 着 算法 的 前 进而 最 终 消 失 。 
在 任何 给 定 的 时 间 ， 所 有 存在 的 活动 ， 只 有 一 个 是 正在 进行 的 ， 其 他 的 都 处 于 等 待 状态 ， 每 一 
个 活动 都 要 等 待 另 一 个 活动 终止 后 方 可 继续 。 
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我 们 在 这 里 





图 5-17 第 二 次 递归 搜索 ， 第 二 个 快照 

作为 一 个 重复 的 过 程 ， 递归 系统 也 依赖 于 与 循环 结构 相似 的 正确 控制 。 就 像 循 环 控制 
一 样 , 递归 系统 也 依赖 于 对 终止 条 件 的 测试 , 同时 也 必须 保证 终止 条 件 能 够 达成 。 事实 上 ， 
正确 的 递归 控制 也 涉及 同样 的 3 个 要 素 一 一 初始 化 、 修 改 和 终止 测试 与 循环 控制 的 要 
求 相同 。 
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TE 


et en ee 
为 什么 蒙 德里 安 的 结果 被 认为 是 艺术 ， 而 我 们 的 却 不 是 . ) a 





def Mondrian (Rectangle) : 
We (用 你 的 艺术 眼光 看 Rectangle 的 尺寸 大 大 ) 1 
把 Rectangle 划 分 成 2 个 较 小 的 长 方形 
i | 
把 函数 Mondzian 应 用 到 另 一 个 较 小 的 长 方形 上 


通常 ， 递 归 函 数 将 终止 条 件 [通常 称 作 基本 条 件 (base case) 或 者 退化 条 件 (degenerative 
case)] 的 测试 设计 在 请 求 更 多 的 活动 之 前 。 如 果 不 满足 终止 条 件 ， 例 程 就 创建 该 函数 的 男 外 一 
个 活动 ， 并 赋予 它 一 项 任务 ， 让 其 解决 一 个 经 过 修改 了 的 问题 ， 与 赋 给 当前 活动 的 任务 相 比 ， 
这 个 任务 距离 终止 条 件 的 距离 要 更 近 一 些 。 但 是 ， 如 果 满 足 终止 条 件 ， 当 前 活动 就 会 终止 ， 并 
且 不 会 再 创建 任何 额外 活动 。 

让 我 们 来 看 看 图 $-14 中 的 二 分 搜索 函数 是 如 何 实现 重复 控制 的 初始 化 阶段 和 修改 阶段 的 。 
在 这 个 例子 中 ， 一 旦 目标 值 被 找到 或 者 任务 被 缩减 到 只 是 完成 对 空 表 的 搜索 ， 额 外 活动 的 创建 
就 会 终止 。 整 个 过 程 是 从 简单 地 给 出 初始 列表 和 目标 值 隐 式 开 始 的 。 从 该 初始 配置 开始 ， 函 数 
就 会 将 其 任务 修改 为 在 更 小 的 列表 中 进行 搜索 。 因 为 原始 列表 的 长 度 有 限 ， 并 且 每 次 修改 步骤 
都 会 减 小 所 考虑 的 列表 长 度 ， 所 以 我 们 确信 目标 值 最 终 会 被 找到 或 者 任务 最 终 会 被 缩减 到 对 空 
表 进 行 搜索 。 因 此 ， 我 们 能 够 推 凯 这 个 重复 过 程 一 定 可 以 停止 。 

最 后 ， 由 于 循环 控制 结构 和 递归 控制 结构 都 是 能 让 一 系列 指令 重复 执行 的 方法 ， 我 们 可 能 
会 问 ， 这 两 种 结构 在 能 力 上 是 否 等 价 。 也 就 是 说 ， 如 果 一 个 算法 是 使 用 循环 结构 设计 的 ， 那 么 
是 和 否 存 在 另 一 个 能 解决 同样 问题 的 使 用 递归 技术 设计 的 算法 ， 反 过 来 呢 ? 这 样 的 问题 在 计算 机 
科学 中 是 很 重要 的 ， 因 为 它们 的 答案 最 终 能 告诉 我 们 : 为 了 获得 可 能 的 最 强大 的 程序 设计 系统 ， 
应 该 在 程序 设计 语言 中 提供 什么 特征 。 我 们 将 在 第 12 章 中 回 到 这 些 问 题 上 来 ， 到 时 ， 我 们 将 会 
把 计算 机 科学 及 其 数学 基础 中 更 具 理论 性 的 一 些 方面 考虑 在 内 。 在 这 种 背景 下 ， 我 们 将 能 够 证 
明 附 录 E 中 提 到 的 “ 返 代 和 递归 结构 的 等 价 性 ” 


问题 与 练习 | 
1. 在 列表 Alice、Brenda、Carol、Duane、Evelyn、Fred、George、Henry、Irene、Joe、 Karl、Larry、 Mary、 
Nancy 和 Oliver 中 ， 用 二 分 搜索 ( 见 图 5-14) 搜索 名 字 Joe 的 时 候 ， 会 询问 到 哪些 名 字 ? 
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2. 当 对 一 个 200 个 条 目的 列表 应 用 二 分 搜索 时 ,最 多 要 询问 多 少 个 条 目 ? 一 个 100 000 个 条 目的 列表 呢 ? 
3. 如 果 N 的 初始 值 为 !， 那 么 下 面 的 递归 函数 会 打印 出 什么 样 的 数列 ? 
def Exercise (N) : 
print (N) | 
UF AN < Ss 
Exercise(N + 1) 


print (N) 


4. 问题 3 中 的 递归 函数 的 终止 条 件 是 什么 ? 


5.6 ”效率 和 正确 性 


在 本 节 中 ， 我 们 介绍 两 个 构成 计算 机 科学 中 重要 研究 领域 的 主题 。 第 一 个 是 算法 效率 ， 第 
二 个 是 算法 正确 性 。 


5.6.1 算法 效率 


尽管 当今 的 机 器 每 秒 可 以 处 理 数 百 万 或 者 数 十 亿 条 指令 ， 但 是 效率 仍旧 是 算法 设计 中 所 关 
注 的 一 个 主要 问题 。 通 常 ， 在 效率 高 低 的 两 个 算法 之 间 的 选择 能 够 产生 对 于 问题 的 实用 或 者 不 
实用 的 两 种 解决 方案 。 

让 我 们 考虑 这 样 一 个 问题 ， 一 个 大 学 的 教务 主任 需要 面 对 检索 和 更 新 学 生 记 录 的 任务 。 尽 管 在 任 
何 一 个 学 期 学 校 可 能 只 有 大 约 10 000 名 学 生 注册 ， 但 是 它 的 “当前 学 生 ” 文 件 包括 了 30 000 多 名 学 生 
的 记录 ， 这 些 学 生 在 过 去 的 几 年 中 至 少 注册 了 一 门 课程 但 并 没有 完成 学 业 ， 所 以 在 某 种 意义 上 被 认为 
是 当前 学 生 。 眼 下 ， 让 我 们 假设 这 些 学 生 的 记录 以 列表 的 形式 存储 于 教务 主任 的 计算 机 中 ， 这 些 列表 
依照 学 生 标识 号 顺序 排列 。 为 了 寻找 任何 一 条 学 生 记录 , 教务 主任 要 在 这 个 列表 中 查找 特定 的 标识 号 。 

我 们 已 经 讲述 了 两 种 可 用 于 在 这 些 已 排序 的 表 中 进行 搜索 的 算法 : 顺序 搜索 和 二 分 搜索 。 
现在 的 问题 是 ， 对 于 教务 主任 ， 这 两 种 算法 是 否 会 带 来 不 同 的 效果 。 我 们 首先 考虑 顺序 搜索 。 

给 定 一 个 学 生 标识 号 ， 顺 序 搜索 算法 从 列表 的 开头 开始 ， 将 所 有 的 条 目 与 期 望 的 标识 号 相 
比较 。 因 为 不 知道 关于 目标 值 的 任何 原始 信息 ， 我 们 无 法 断定 这 个 搜索 要 向 列表 中 走 多 远 。 但 
是 ， 在 多 次 搜索 之 后 ， 我 们 认为 平均 搜索 深度 是 列表 长 度 的 一 半 ; 有 的 可 能 短 一 些 ， 有 的 可 能 
长 一 些 。 因 此 ， 经 过 一 段 时 间 我 们 估计 ， 顺 序 搜索 平均 每 次 大 概 需 要 检查 15 000 条 记录 。 如 果 
检索 并 且 检 查 每 一 条 记录 需要 10 毫 秒 〈1 秒 的 千 分 之 十 )， 那 么 这 样 的 搜索 平均 需要 150 秒 或 2.5 
分 钟 一 一 这 个 时 间 对 于 等 待 计算 机 屏幕 显示 学 生 记录 的 教务 主任 来 说 是 不 可 忍受 的 。 即 使 检索 
和 检查 每 条 记录 只 需要 1 毫秒 ， 那 么 整个 搜索 仍然 需要 大 概 15 秒 ， 这 个 等 待 时 间 仍 然 较 长 。 

相 比 之 下 ， 二 分 搜索 算法 通过 比较 目标 值 和 列表 的 中 间 条 目 来 进行 搜索 。 即 使 中 间 条 目 不 是 期 
望 的 记录 ， 至 少 也 将 搜索 限制 在 了 原始 列表 的 一 半 。 因 此 ， 在 询问 一 个 有 30 000 条 学 生 记录 的 列表 
的 中 间 条 目 之 后 ， 二 分 搜索 需要 再 次 考虑 最 多 15 000 条 记录 。 在 第 二 次 搜索 之 后 ， 最 多 还 剩 7500 条 ， 
然后 在 第 三 次 后 ， 又 会 降 至 不 多 于 3750 条 记录 。 照 此 继续 ， 我 们 看 到 ， 最 多 检索 15 次 之 后 ， 就 能 在 
这 个 有 30 000 条 记录 的 列表 中 找到 目标 值 。 因 此 ， 如 果 每 一 次 检索 需要 10 毫 秒 来 完成 ， 那 么 搜索 一 
个 特定 记录 的 过 程 就 只 需要 0.15 秒 一 一 这 意味 着 ， 对 于 教务 主任 来 说 ， 访 问 任何 特定 学 生 记 录 可 以 
瞬间 完成 。 我 们 得 出 结论 : 在 顺序 搜索 算法 和 二 分 搜索 算法 之 间 的 选择 将 对 该 应 用 产生 巨大 影响 。 

这 个 例子 表明 了 计算 机 科学 领域 中 大 家 熟知 的 算法 分 析 的 重要 性 ， 这 种 分 析 包含 了 对 于 资 
源 《〈 如 时 间或 者 存储 空间 ) 的 研究 。 这 种 研究 的 一 个 主要 应 用 是 对 和 蔡 代 算 法 相对 优 劣 的 评 佑 。 
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算法 分 析 通 常 包括 最 佳 情况 、 最 差 情况 和 平均 情况 。 在 上 面 的 例子 中 ， 我 们 通过 分 析 平 均 
情况 下 的 顺序 搜索 算法 和 最 差 情况 下 的 二 分 搜索 算法 ， 估 计 了 搜索 一 个 30 000 条 记录 的 列表 所 
需 的 时 间 。 通 常 这 种 分 析 应 该 在 更 为 普通 的 情况 下 进行 。 也 就 是 说 ， 当 考虑 搜索 列表 的 算法 时 ， 
我 们 不 能 只 考虑 某 个 特定 长 度 的 列表 ， 而 是 要 尝试 找 出 一 个 公式 ， 指 示 这 种 算法 对 于 任意 长 度 
的 列表 的 性 能 。 基 于 我 们 之 前 的 推理 ， 不 难得 出 对 于 任意 长 度 的 列表 均 有 意义 的 公式 。 具 体 而 
言 ， 当 应 用 于 含有 na 个 条 目的 列表 时 ， 顺 序 搜索 算法 将 需要 询问 平均 /2 个 条 目 ， 而 二 分 搜索 算 
法 在 最 差 情况 下 最 多 要 询问 logan 个 条 目 。(logzn 表 示 以 2 为 底 n 的 对 数 。 除 非 男 有 说 明 ， 计算 机 
科学 家 在 谈论 对 数 时 ， 通 常 是 指 以 2 为 底 的 对 数 。) 

我 们 现在 用 类 似 的 办 法 分 析 插 入 排序 算法 (如 图 5-11 所 示 )。 回 想 可 知 ， 这 个 算法 需要 选择 
一 个 称 为 主 元 的 列表 条 目 ， 将 这 个 条 目 与 这 个 条 目 之 前 的 那些 条 目 进 行 比 较 ， 直 到 找到 正确 的 
插入 位 置 ， 然 后 将 主 元 插入 这 个 位 置 。 因 为 该 算法 主要 涉及 两 个 条 目 之 间 的 比较 ， 我 们 的 方法 
是 计算 在 对 长 度 为 n 的 列表 进行 排序 时 需要 进行 的 比较 次 数 。 

算法 从 把 列表 的 第 三 个 条 目 当 作 主 元 开始 。 然 后 ， 算 法 继续 选择 后 面 的 条 目 作 为 主 元 直到 
列表 的 末尾 。 在 最 佳 情况 下 ， 每 一 个 主 元 都 已 经 在 合适 的 位 置 ， 于 是 它 只 需要 与 一 个 条 目 进行 
比较 。 因 此 ,在 最 佳 情况 下 ， 将 插入 排序 应 用 到 一 个 有 zw 个 条 目的 列表 需要 进行 二 1 次 比较 。( 第 
二 个 条 目 与 一 个 条 目 比 较 ， 第 三 个 条 目 与 一 个 条 目 比较 ， 依 次 类 推 。) 

相反 ， 在 最 差 情况 下 ， 每 一 个 主 元 都 必须 与 列表 中 排 在 它 前 面 的 所 有 条 目 进 行 比较 ， 然 后 
才能 找到 合适 的 位 置 。 这 种 情况 发 生 在 原始 列表 为 反 向 排序 的 时 候 。 在 这 种 情况 下 ， 第 一 个 主 
元 〈 列 表 的 第 二 个 条 目 ) 要 与 一 个 条 目 进行 比较 ， 第 二 个 主 元 〈 列 表 的 第 三 个 条 目 ) 要 与 两 个 
条 目 进行 比较 ， 依 次 类 推 〔( 见 图 $-18)。 因 此 ， 在 给 有 7 个 条 目的 列表 进行 排序 时 ， 总 共 需 要 进 
行 的 比较 次 数 为 1+2+3+…+(m-1)， 也 就 是 了 (7 加。 具体 而 言 ， 如 果 一 个 列表 包含 10 个 条 目 ， 


那么 在 最 差 情 况 下 ， 插 入 排序 算法 需要 进行 45 次 比较 。 
ee 对 每 个 主 元 所 做 的 比较 








， Elaine . ee 


David 





图 5-18 ”将 插入 排序 应 用 于 最 差 情 况 中 
在 插入 排序 的 平均 情况 中 ， 我 们 期 望 每 We 与 其 前 面 的 一 半 条 目 进行 比较 。 这 样 一 来 ， 
一 共 需 要 执行 的 次 数 是 最 坏 情况 的 一 半 ， 也 就 是 二 4 一 n) 次 比较 可 以 完成 对 n 个 条 目的 列表 的 排 
序 。 例如， ey 平均 情况 下 每 次 排序 需要 22.5 次 比较 。 
这 些 结果 的 重要 性 在 于 ， 插 入 排序 算法 执行 中 的 比较 次 数 给 出 了 执行 这 种 算法 所 需 的 近似 
时 间 量 。 使 用 这 个 近似 值 ， 图 5-19 显 示 了 一 个 当 列 表 的 长 度 增加 时 ， 执 行 插入 排序 算法 所 需 时 
间 如 何 增长 的 示意 图 。 该 图 是 根据 我 们 对 这 个 算法 的 最 坏 情况 的 分 析 画 的 ， 在 此 分 析 中 ， 我 们 
推算 出 在 长 度 为 n 的 列表 中 进行 排序 最 多 需要 OP -号 次 比较 。 在 图 中 ， 我 们 标 出 了 几 个 列表 
的 长 度 ， 同 时 给 出 了 在 每 一 种 情况 下 需要 的 时 间 。 注 意 ， 当 列表 的 长 度 均匀 增长 时 ， 排 序 需要 
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的 时 间 的 增长 速度 更 快 。 因 此 ， 随 着 列表 长 度 的 增加 ， 这 个 算法 的 效率 会 越 来 越 低 。 
执行 算法 所 需要 的 时 间 


增加 列表 长 度 
时 时 间 的 增长 








列表 的 长 度 


长 度 均匀 增长 


图 5-19 ”插入 排序 算法 的 最 差 情况 分 析 图 

让 我 们 使 用 相似 的 方法 来 分 析 一 下 二 分 搜索 算法 。 回 顾 一 下 我 们 前 面 得 到 的 结论 ， 使 用 该 
算法 在 含有 n 个 条 目的 列表 中 进行 搜索 的 时 候 需 要 最 多 询问 logzn 个 条 目 ,这 又 给 出 了 对 不 同 长 度 
的 列表 执行 这 一 算法 时 所 需 的 近似 时 间 量 。 图 5-20 给 出 了 基于 这 个 分 析 画 出 的 图 ， 在 这 张 图 里 ， 
我 们 依旧 标 出 了 几 个 长 度 均 匀 增 长 的 列表 ， 并 标 出 了 每 种 情况 下 算法 执行 所 需要 的 时 间 。 注意， 
算法 随 着 列表 长 度 的 增加 ， 对 于 时 间 需 求 的 增加 是 在 逐步 递减 的 。 也 就 是 说 ， 随 着 列表 长 度 的 
增加 ， 二 分 搜索 算法 的 效率 会 越 来 越 高 。 

图 5-19 和 图 5-20 的 区 别 在 于 图 的 大 体形 状 ， 该 大 体形 状 揭 示 了 一 个 算法 在 应 对 越 来 越 大 的 输 
入 规模 的 情况 下 到 底 有 多 好 。 此 外 ， 一 个 图 像 的 大 体形 状 是 由 表达 式 的 类 型 而 非 具 体 的 表达 式 所 
确定 的 : 所 有 的 线性 表达 式 都 会 产生 一 条 直线 ， 所 有 的 二 次 表达 式 都 会 产生 一 条 抛物 线 ;， 所 有 的 
对 数 表达 式 都 会 产生 一 条 图 5-20 所 示 的 对 数 曲线 。 习 惯 上 我 们 用 可 以 产生 一 个 形状 的 最 简单 的 表 
达 式 来 标识 该 形状 ， 有 具体 而 言 ， 我 们 用 表达 式 扩 来 标识 抛物 线 ， 用 logzx 来 标识 对 数 曲线 。 

执行 算法 所 需要 的 时 间 





[ 
增加 列表 长 度 || 瑟 
时 时 间 的 增 量 
会 减少 








列表 长 度 
长 度 均匀 增长 


图 5-20 ”二 分 搜索 算法 的 最 差 情况 分 析 图 
由 于 通过 比较 一 个 算法 执行 任务 所 需要 的 时 间 与 其 输入 数据 大 小 所 得 的 图 形 ， 可 以 反映 该 算 
法 的 效率 特性 ， 因 此 可 以 根据 这 些 图 的 形状 对 算法 进行 分 类 一 一 通常 是 基于 算法 的 最 差 情 况 分 
析 。 用 来 标识 这 些 类 型 的 符号 有 时 称 作 大 @ 符 号 〈big-theta notation)。 所 有 图 形 为 抛物 线 的 算法 ， 
如 插入 排序 算法 ， 都 划 归 为 @() 读 作 “n 的 平方 的 大 @”) 表示 的 算法 类 型 ， 所 有 图 形 为 对 数 曲 
线 的 算法 ， 如 二 分 搜索 算法 ， 都 划分 到 B@(ogzn)〔 读 作 “ 以 2 为 底 n 的 对 数 的 大 @”) 表示 的 算法 类 
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型 中 。 知 道 特定 算法 所 属 的 类 型 使 我 们 可 以 预测 它 的 性 能 ， 并 且 可 以 拿 它 与 能 够 解决 相同 问题 的 
其 他 算法 进行 比较 。 两 个 80 算法 在 输入 大 小 增加 的 时 候 ， 对 于 时 间 将 会 有 相近 的 需求 变化 。 此 
外 ，@(ogzm) 算 法 不 会 像 @(z) 算 法 那样 ， 随 着 输入 大 小 的 增加 对 时 间 的 需求 扩张 得 那么 快 。 


5.6.2 ”软件 验证 


回想 波 利 亚 对 于 问题 求解 的 分 析 ( 见 5.3 节 ), 其 中 第 4 阶段 就 是 对 问题 解决 方案 的 准确 性 和 其 作 
为 求解 其 他 问题 的 工具 的 潜力 进行 评价 。 通 过 下 面 这 个 例子 可 以 例证 这 个 阶段 第 一 部 分 的 重要 性 。 
一 位 拿 着 由 7 个 金 环 组 成 的 链子 的 旅行 者 必须 在 一 个 旅馆 里 住 7 夜 。 每 一 夜 的 租 
金 是 金 链 中 的 一 环 。 链 子 必 须 最 少 切割 多 少 次 ， 旅 行者 才能 每 天 早上 支付 旅馆 的 一 环 
而 不 用 提前 支付 住宿 费 ? 


要 解决 这 个 问题 ， 首 先 我 们 要 认识 到 并 不 是 每 一 环 都 要 切 开 。 如 果 只 切 开 第 2 个 环 ， 那 么 我 
们 就 可 以 让 第 1 个 环 和 第 2 个 环 与 男 外 5 个 环 分 开 。 按照 这 个 想法 ,我 们 得 到 这 样 一 种 解 ， 就 是 只 
需要 切割 链 中 的 第 2、 第 4 和 第 6 个 环 ， 这 个 过 程 在 将 所 有 的 环 分 开 的 同时 只 对 3 个 环 进行 了 切割 
〈 见 图 $-21)。 此 外 ， 任 何 更 少 次 数 的 切割 都 会 留 下 2 个 仍然 连 在 一 起 的 环 ， 所 以 我 们 可 能 会 得 出 
结论 ， 这 个 问题 的 正确 答案 是 3 次 。 

然而 ， 进 一 步 考虑 这 个 问题 ， 我 们 可 能 会 观察 到 ， 在 只 有 第 3 个 环 被 切 开 的 时 候 ， 我 们 会 获 
得 3 段 金 链 ， 长 度 分 别 是 1、2 和 4( 见 图 5-22)。 对 这 些 段 ， 我 们 可 以 进行 如 下 操作 。 

第 1 天 早上 : 给 饭店 1 个 环 。 

第 2 天 早上 : 给 饭店 1 个 2 个 环 的 金 链 ， 同 时 找 回 1 个 环 。 

第 3 天 早上 : 给 饭店 1 个 环 。 

第 4 天 早上 : 把 4 个 环 的 金 链 给 饭店 ， 同 时 找 回 原先 给 饭店 的 那 3 个 环 。 

第 5 天 早上 : 给 饭店 1 个 环 。 

第 6 天 早上 : 给 饭店 1 个 2 个 环 的 金 链 ， 同 时 找 回 1 个 环 。 

第 7 天 早上 : 给 饭店 1 个 环 。 





图 5-21 只 用 3 次 切割 将 链子 分 开 图 5-22 ”只 用 1 次 切割 解决 这 个 问题 


因此 ， 第 一 个 答案 ， 即 我 们 认为 正确 的 那个 ， 实 际 上 是 不 正确 的 。 然 而 ， 我 们 又 如 何 认 定 我 们 
这 个 新 的 解决 方案 是 正确 的 呢 ? 可 以 这 样 论 证 : 因为 一 个 单个 的 环 必须 在 第 1 天 早上 给 饭店 ,所 
以 至 少 要 从 金 链 上 切 一 个 环 下 来 ， 同 时 因为 新 的 解决 方案 只 需要 一 次 切割 , 所 以 必定 是 最 优 的 。 

转换 到 程序 设计 环境 中 ， 这 个 例子 强调 了 一 个 被 认为 正确 的 程序 和 一 个 正确 的 程序 之 间 的 
区 别 ， 二 者 并 不 一 定 相 同 。 数 据 处 理 领 域 充满 了 可 怕 的 故事 ， 比 如 尽管 “知道 ”一 个 软件 是 正 
确 的 ， 但 最 终 还 是 因为 一 些 没有 预料 到 的 情况 而 在 关键 的 时 刻 发 生 错误 。 因 此 软件 验证 很 重要 ， 
并 且 发 现 有 效 的 验证 技术 也 成 为 了 计算 机 科学 中 一 个 活跃 的 研究 领域 。 

在 这 个 领域 内 ,研究 的 一 条 主线 尝试 把 形式 逻辑 技术 用 于 证 明 一 个 程序 的 正确 性 。 也 就 是 
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说 ， 目 标 是 用 形式 逻辑 来 证 明 程 序 表达 的 算法 确实 做 了 它 试 图 做 的 工作 。 基 本 的 课题 是 通过 将 
验证 过 程 简化 为 一 个 形式 过 程 ， 防 止 那些 可 能 与 直觉 有 关 的 不 准确 的 推断 ， 就 像 金 链 问题 一 样 。 
下 面 来 更 详细 地 讨论 如 何 把 这 个 方法 应 用 于 程序 验证 中 。 





文中 所 讨论 的 验证 问题 并 不 是 软件 独 有 的 的 - 确认 执行 和 庄 的 硬件 没有 缺陷 是 一 个 同等 重 

要 的 问题 ， 这 涉及 电路 设计 和 机 器 构造 的 验证 。 而且， 质量 的 优 劣 非常 依赖 于 测试 ， 就 像 在 

软件 中 所 做 的 那样 ， 这 意味 着 任何 一 个 细微 的 错误 都 可 能 出 现在 最 终 的 产品 中 。 据 记载 ， 在 20 

.世纪 40 年 代 ， 由 哈佛 大 学 建造 的 马克 一 号 ， 包 含 了 很 多 布线 错误 ， 而 这 些 错误 很 多 年 都 没有 被 

发 现 。 在 20 世 纪 90 年 代 ， 在 早期 奔腾 微 处 理 器 中 浮 点 部 分 出 现 过 一 个 缺陷 ， 这 个 缺陷 导致 数字 
被 0 除 时 计算 出 的 答案 是 错误 的 。 在 这 两 个 例子 中 ， 错 误 都 是 在 产生 严重 后 果 之 前 被 发 现 的 。 


就 好 像 形式 数学 证 明 要 基于 公理 〈 几 何 证 明 通 第 基于 欧 几 里 得 几何 公理 ， 而 其 他 证 明 则 基 
于 集合 论 的 公理 ) 进行 一 样 ， 一 个 程序 的 正确 性 的 形式 证 明 是 基于 设计 程序 所 使 用 的 规格 说 明 
进行 的 。 为 了 证 明 一 个 程序 可 正确 地 对 名 字 列 表 进 行 排序 ， 不 妨 假设 程序 的 输入 是 一 个 名 字 列 
表 ， 或 者 ， 如 果 一 个 程序 是 设计 用 来 计算 一 个 或 者 更 多 个 正 数 的 平均 值 ， 则 假设 实际 上 输入 是 
由 一 个 或 多 个 正 数组 成 。 简 言 之 ， 正 确 性 的 证 明 是 从 若干 确 定 条 件 的 假设 开始 的 ， 这 个 条 件 称 
作 前 置 条 件 〈precondition)， 以 此 来 满足 程序 执行 开始 的 需要 。 

正确 性 证 明 的 下 一 步 是 考虑 这 些 前 置 条 件 的 结果 是 如 何在 程序 中 传播 的 。 为 了 这 个 目的 ， 
研究 人 员 分 析 了 各 种 各 样 的 程序 结构 来 确定 一 条 语句 (已 知 在 结构 执行 之 前 为 真 ) 是 如 何 受 到 
结构 执行 的 影响 的 。 作 为 一 个 简单 的 例子 ， 如 果 在 执行 指令 


X= YY 


之 前 ， 已 知 一 条 关于 Y 值 的 语 名 成立， 那么 在 该 指令 执行 完 之 后 ， 那 条 关于 Y 值 的 语句 对 X 值 也 
同样 成 立 。 更 准确 地 讲 ， 如 果 在 指令 执行 之 前 已 知 Y 的 值 不 为 0， 那 么 可 以 推断 ， 指 令 执 行 以 后 
X 的 值 也 不 为 0。 
一 个 稍微 复杂 点 的 例子 发 生 在 下 面 这 样 的 过 else 结 构 中 。 
if (condition): 
instruction A 
else: 
instruction B 


此 处 ， 如 果 某 个 已 知 的 语句 在 结构 执行 以 前 成 立 ， 那 么 在 执行 nstruction A 之 前 ， 我 们 
知道 那 条 语句 和 那个 测试 条 件 皆 为 真 ， 相反 ， 如 果 要 执行 的 是 instruction B， 那 么 我 们 就 知 
道 那 条 语句 和 测试 条 件 的 否定 一 定 成 立 。 

依照 这 些 规则 ， 可 以 通过 识别 称 作 断 言 (assertion) 的 语句 来 进行 正确 性 的 证 明 ， 断 言 可 以 
建立 在 不 同 的 程序 点 上 。 所 得 到 的 结果 是 一 个 断言 集合 ， 每 一 个 都 是 程序 前 置 条 件 的 一 个 结果 
以 及 可 以 导致 在 程序 中 某 点 建立 断言 的 一 组 指令 。 如 果 在 程序 的 末尾 建立 的 断言 可 以 得 到 想 要 
的 输出 [ 称 为 后 置 条 件 (postcondition)]， 我 们 就 能 够 断定 程序 是 正确 的 。 

作为 一 个 例子 ， 考虑 图 5-23 中 所 示 的 一 个 典型 vzhile 循 环 结构 。 假 设 ， 作 为 在 A 点 给 定 的 前 
置 条 件 的 结果 ,循环 过 程 中 每 次 终止 测试 的 时 候 (B 点 ), 我 们 都 能 确认 一 个 特定 断言 为 真 。[ 对 
于 一 个 存在 于 某 个 御 环 内 施 的 菜 个 断言 ， 如 时 在 每 次 执行 到 这 个 循环 的 这 一 点 时 均 为 真 ， 则 称 
作 循 环 不 变 式 (loop invariant)。] 然后， 如 果 箱 环 一 旦 终止 ，C 点 就 会 开始 专 行 。 此 由 我 们 可 以 
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推断 循环 不 变 式 和 终止 条 件 此 时 均 成 立 。( 循 环 不 变 式 仍 旧 成 立 是 因为 终止 测试 不 改变 程序 中 的 
任何 值 ， 终 止 条 件 成 立 是 因为 否则 循环 不 会 终止 。) 如 果 这 些 组 合 语句 暗示 着 期 望 的 后 置 条 件 ， 
我 们 的 正确 性 证 明 仅仅 通过 初始 化 和 修改 最 终 导致 终止 条 件 的 循环 组 件 就 可 以 完成 。 


| 前 置 条 件 


初始 化 


循环 不 变 式 | 


< _ 循环 不 变 式 与 终止 条 件 


图 5-23 与 典型 while 结 构 相 关联 的 断言 


应 该 拿 这 个 分 析 与 图 5-11 中 关于 插入 排序 的 例子 相 比 较 。 那 个 程序 的 外 层 循环 所 依据 的 循 
环 不 变 式 是 : 


每 次 执行 终止 测试 的 时 候 ， 列 表 中 从 位 置 1 到 位 置 N-1 的 条 目 都 已 排序 
终止 条 件 是 
NN 的 值 大 于 列表 的 长 度 


因此 ， 如 果 循 环 终止 ， 我 们 就 知道 两 个 条 件 一 定 都 满足 了 ， 这 暗示 着 整个 列表 已 排序 。 

程序 验证 技术 发 展 的 进步 依然 非常 具有 挑战 性 。 即 便 这 样 ， 还 是 取得 了 一 些 进展 ， 其 中 一 
个 更 具 重 要 性 的 进展 是 在 程序 设计 语言 SPARK 中 发 现 的 ，SPARK 语 言 与 更 为 流行 的 Ada 语 言 之 
间 有 着 紧密 的 联系 。( 关 于 Ada 语 言 ， 我 们 将 在 下 一 章 举 例 说 明 。) 除了 人 允许 程序 用 像 伪 代 码 这 
样 的 高 层 形式 表示 之 外 ， 还 给 程序 员 提 供 了 包含 断言 的 方法 ， 如 程序 里 的 前 置 条 件 、 后 置 条 件 
和 循环 不 变 式 。 这 样 ， 用 SPARK 语 言 编 写 的 程序 不 仅仅 包含 了 应 用 的 算法 ， 还 包含 了 形式 化 正 
确 性 证 明 技术 应 用 所 需 的 信息 。 迄 今 为 止 ，SPARK 已 经 成 功 地 应 用 于 涉及 关键 软件 应 用 的 很 多 
软件 开发 项 目 中 ,包括 美国 国家 安全 局 的 安全 软件 、 美 国 洛克 希 德 马丁 公司 的 C130J 大 力 神 运 
输 机 的 内 部 控制 软件 以 及 关键 铁路 运输 控制 系统 。 

尽管 有 SPARK 这 样 的 成 功 案例 ， 但 形式 化 程序 验证 技术 并 没有 得 到 广泛 的 应 用 ， 因 此 今天 
大 多 数 的 软件 还 是 通过 测试 来 进行 “验证 ”， 而 这 个 过 程 是 不 可 靠 的。 毕竟 ， 通 过 测试 进行 的 验 
证 仅 能 证 明 程序 对 于 测试 的 案例 是 正确 的 ， 任 何 附加 的 结论 都 仅仅 是 推测 。 程 序 中 包含 的 错误 往 
往 都 是 测试 和 开发 过 程 中 没有 注意 到 的 一 些 细微 疏忽 的 结果 。 因 此 ， 就 像 我 们 在 黄金 链 问 题 中 的 
错误 一 样 ， 尽 管 做 了 很 大 的 努力 去 避免 它 ， 但 是 程序 中 的 错误 往往 还 是 发 现 不 了 。ATI&T 发 生 过 
一 个 戏剧 性 的 例子 ， 控 制 114 交 换 站 的 软件 中 有 一 个 错误 ， 从 1989 年 12 月 安装 起 到 1990 年 1 月 15 日 
都 未 被 发 现 ， 在 这 段 时 间 里 ， 一 组 独特 的 环境 致使 大 约 500 万 次 呼叫 被 不 必要 地 阻塞 了 9 小 时 。 





问题 与 练习 

. 假设 有 一 台 使 用 插入 排序 算法 编程 的 机 器 , 排序 100 个 名 字 的 列表 平均 需要 1 秒 。 佑 算 一 下 对 1000 个 名 
字 的 列表 排序 需要 多 长 时 间 ? 10 000 个 名 字 的 列表 呢 ? 

为 下 面 的 每 种 类 型 列 出 一 个 算法 的 例子 : 8@(log2n)、@(n) 和 @(n7)。 

将 下 列 类 型 按 有 效 性 递减 顺序 排列 : @(n”)、e@(1ogzn)、@(n) 和 (mn)。 

. 考虑 下 面 的 问题 和 建议 答案 。 看 看 建议 答案 是 正确 还 是 错误 。 为 什么 ? 
问题 : 假设 一 个 盒子 里 有 3 张 卡片 ， 其 中 一 张 两 面 都 涂 成 黑色 ， 另 一 张 两 面 都 涂 成 红色 ， 第 三 张 一 面 涂 成 黑 

， 色 , 另 一 面 涂 成 红色 。 抽出 其 中 一 张 卡片 ,只 允许 看 一 面 , 那么 男 一 面 与 你 所 看 到 的 颜色 相同 的 概率 有 多 大 ? 
建议 答案 : 二 分 之 一 。 假设 你 看 到 的 卡片 的 那 一 面 是 红色 的 如果 是 黑色 的 ,讨论 结 果 也 是 一 样 的 )。 
三 张 卡片 中 只 有 两 张 有 红色 的 一 面 , 因此 你 看 到 的 卡片 必 是 这 两 张 中 的 一 张 。 这 两 张 中 的 一 张 背 面 也 
是 红色 ， 另 一 张 背 面 就 是 黑色 ， 因 此 你 看 到 的 卡片 背面 是 红色 的 概率 和 是 黑色 的 概率 一 样 大 。 

. 下 面 的 程序 段 是 计算 两 个 正 整 数 (一 个 被 除数 和 一 个 除数 ) 的 商 〈 不 考虑 余数 ) 的 一 种 尝试， 方法 是 
计算 从 被 除数 中 减 去 除数 ， 直 到 余数 比 除数 小 时 减 的 次 数 。 例 如 ，7/3 对 应 的 结果 应 该 为 2， 因 为 3 可 
以 从 7 中 减 2 次 。 这 个 程序 正确 吗 ? 证 明 你 的 结论 。 

Count = 0 ， 
Remainder = Dividend 


和 a 


Ce 


bs] 


repeat: 
Remainder = Remainder - Divisor 
.Count = Count 1 \ 
until (Remainder < Divisor) 
Quotient = Count 


.下面 的 程序 是 通过 累计 x 个 ?的 总 和 的 方法 来 计算 非 负 整 数 X 和 Y 的 积 。 也 就 是 说 ，3 乘 以 4 就 是 计算 3 
个 4 的 总 和 。 下 面 这 段 程序 对 吗 ? 证 明 你 的 结论 。 
Product = Y 
Count = 1 
while (Count < X) : 
Product = Product + Y 
Count = Count + 1 


, 假设 前 置 条 件 是 ，N 的 值 是 一 个 正 整 数 ， 建 立 一 个 循环 不 变 式 ， 使 得 若 下 面 的 例 程 终止 ，sum 被 赋值 为 
0+1+2+… 十 V。 


CN 


一 1 


Sum = 0 
由 Re 
while (K < N) : 
KR Kt 1 
Sum = Sum pp 


讨论 该 例 程 终止 时 的 真正 结果 。 
8. 假设 一 个 程序 以 及 执行 它 的 硬件 都 已 被 形式 化 地 验证 过 是 准确 的 ， 那 么 这 样 就 能 保证 准确 性 吗 ? 


me ee it ee 


复习 题 


( 带 * 的 题目 涉及 选 学 章节 的 内 容 。) 给 出 的 正式 定义 。 
1. 给 出 一 组 步骤 的 例子 ， 使 它 符合 5.1 节 开始 部 2. 解释 建议 算法 的 歧义 性 和 算法 表示 的 歧义 性 
分 给 出 的 算法 的 非 正式 定义 ， 但 不 符合 图 5-1 的 区 别 。 
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. 描述 如 何 使 用 原 语 来 帮助 消除 算法 表示 中 的 


歧义 性 。 


. 选择 一 个 你 比较 熟悉 的 学 科 ， 并 设计 一 种 伪 代 


码 来 描述 该 学 科 。 其 中 , 要 描述 你 要 使 用 的 原 
语 以 及 用 于 表示 它们 的 语法 。( 如 果 你 想 不 出 
什么 熟悉 的 科目 , 可 以 考虑 体育 、 艺 术 或 者 工 
艺 等 。) 


. 从 严格 意义 上 讲 , 下 面 的 程序 表示 的 是 一 个 算 


法 吗 ? 为 什么 ? 

Count = 0 

while 人 (Count != 5): 
Count = Count + 2 


. 从 什么 意义 上 讲 ， 下 列 3 个 步骤 并 不 构成 一 个 


算法 ? 

第 1 步 : 在 直角 坐标 系 的 点 (2,5) 和 点 (6,11) 
之 间 画 一 条 直线 段 。 

在 直角 坐标 系 的 点 〈13) 和 点 (3,6) 
之 间 画 一 条 直线 段 。 

以 上 面 两 条 线段 的 交点 为 中 心 ， 画 一 
个 半径 为 2 的 圆 。 


第 2 步 : 


第 3 步 : 


. 用 repeat 结 构 代 替 while 结 构 重 写 下 面 的 


程序 段 ， 确 保 它 能 够 输出 与 原 程序 相同 的 值 。 


Count = 2 

while (Count < 7) : 
print (Count) 
Count = Count + 1 


. 利用 while 结 构 代 替 repeat 结 构 重 写 下 面 的 


程序 段 ， 确 保 它 能 够 输出 与 原 程序 相同 的 值 。 


Count = 1 

repeat: 
print (Count) 
Count = Count + 1 
until (Count == 5) 


repeat: 
Wa 这 
a 尺 w 澡 忘 浊 
形式 表达 的 后 测试 循环 转换 为 以 
do: 
rw 志 珊 江 
WL 
形式 表达 的 等 价 的 后 测试 循环 ， 怎 样 进行 ? 
设计 一 个 算法 ， 当 给 定数 字 0, 1, 2, 3, 4, 5, 6, 7， 


J 
ph 


ps 
Co 
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8, 9 的 一 个 排列 时 ， 重 新 排列 这 些 数字 ， 使 产 
生 的 新 排列 的 数值 在 这 些 数字 所 有 可 能 的 排 
列 中 仅 比 原 排列 的 数值 大 (或 者 报告 不 存在 更 
大 的 排列 )。 例 如 ，5647382901 将 产生 排列 
5647382910。 


. 设计 一 个 算法 ， 找 出 一 个 正 整数 的 所 有 因子 。 


例如 ， 对 于 整数 12， 该 算法 应 该 报告 值 1、2、 
3、4、6 和 12。 


. 设计 一 个 算法 ， 计 算 从 1700 年 1 月 1 日 起 的 任意 一 


天 是 星期 几 。 例 如 ，2001 年 8 月 17 日 是 星期 五 。 


. 正式 程序 设计 语言 和 伪 代 码 的 区 别 是 什么 ? 
. 语法 和 语义 之 间 的 区 别 是 什么 ? 
. 下 面 是 一 个 传统 的 十 进 制 加 法 问题 , 每 个 字母 


表示 不 同 的 数字 。 问 每 个 字母 表示 什么 数字 ? 
你 是 怎样 迈 出 第 一 步 的 ? 


XYZ 
+ YWY 
ZYZW 





. 下 面 是 一 个 传统 的 十 进 制 乘法 问题 ,每 个 字母 


表示 不 同 的 数字 。 问 每 个 字母 表示 什么 数字 ? 
你 是 怎样 迈 出 第 一 步 的 ? 


XY 





. 下 面 是 一 个 二 进 制 加 法 问题 , 每 个 字母 表示 不 


同 的 二 进 制 数字 。 问 哪个 字母 表示 1， 哪 个 字 
母 表示 0? 请 为 解决 此 类 问题 设计 一 个 算法 。 
YXX 


+ XYX 
YY 





. 有 4 位 采矿 者 ， 他 们 只 有 一 个 提 灯 ， 并 且 必 须 


走路 通过 挖 煤 的 坑道 。 他 们 最 多 可 以 两 个 人 一 
起 通过 ， 并 且 其 中 一 个 人 必须 拿 着 提 灯 。 这 4 
位 采矿 者 分 别 叫 Andrews、Blake、Johnson 和 
Kelly， 他 们 单独 通过 矿井 的 时 间 分 别 是 1 分 
钟 、2 分 钟 、4 分 钟 和 8 分 钟 。 当 两 个 人 一 起 通 
过 坑道 时 , 要 以 速度 慢 的 人 的 速度 为 准 ,， 如 何 
安排 才能 使 这 4 人 在 15 分 钟 内 通过 坑道 ? 在 求 
解 完 这 道 题 后 ， 解 释 你 是 怎样 迈 出 第 一 步 的 。 
有 一 大 一 小 两 个 酒杯 ， 先 往 小 酒杯 中 倒 满 酒 ， 
再 把 小 酒杯 中 的 酒 倒 入 大 酒杯 。 然后 , 把 小 酒 
杯 中 倒 满 水 , 再 把 小 酒杯 中 的 一 些 水 倒 入 大 酒 
杯 。 在 大 酒杯 中 均匀 搅拌 , 再 把 混合 液体 倒 回 
到 小 酒杯 , 直到 倒 满 。 请 问 此 时 大 酒杯 中 的 水 
和 小 酒杯 中 的 酒 哪个 多 ?解释 你 是 怎样 迈 出 
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第 一 步 的 。 
20. 两 只 蜜蜂 ， 一 只 叫 罗 密 欧 ， 一 只 叫 朱 丽 叶 ， 它 


2 上 


22 


23， 


24. 


2， 


26. 


27. 


们 住 在 不 同 的 蜂 房 , 但 是 相爱 了 。 在 一 个 无 风 
的 春天 早晨 ， 它 们 同时 离开 各 自 的 蜂 房 来 相 
会 ,它们 相遇 的 地 点 在 距离 最 近 的 蜂 房 50 米 的 
地 方 , 但 它们 都 没 看 到 对 方 ， 因此 继续 按 各 自 
的 方向 飞 ， 直到 飞 到 对 方 的 蜂 房 。 它们 用 了 同 
样 多 的 时 间 发 现 对 方 没 在 家 ,并 开始 返回 。 在 
距离 最 近 蜂 房 20 米 的 地 方 , 它们 又 相遇 了 , 这 
次 它们 看 到 了 对 方 ， 并 在 回 家 之 前 去 野餐 了 。 
请 问 这 两 个 蜂 房 的 距离 是 多 少 ? 在 求解 完 这 
道 题 后 ， 解 释 你 是 怎样 迈 出 第 一 步 的 。 
设计 一 个 算法 , 给 定 两 个 字符 串 , 测试 第 一 个 
字符 串 是 否 是 第 二 个 字符 串 的 子 串 。 
下 面 这 个 算法 是 用 来 打印 所 谓 的 斐 波 那 契 序 
列 的 开始 部 分 的 。 请 标识 这 个 循环 体 , 哪儿 是 
循环 控制 的 初始 化 步骤 ? 哪儿 是 修改 步骤 ? 
哪儿 是 测试 步骤 ? 产生 的 数字 列表 是 什么 ? 
Last = 0 
Current = 1 
while {Current < 100): 

print (Current) 

Temp = Last 

Last = Current 

Current = Last + Temp 


在 下 面 的 算法 中 , 如果 输入 值 分 别 以 0 和 1 开 
始 ， 打 印 的 数 的 序列 是 什么 ? 
def MysteryWrite (Last, 
if,. (Curent < TO00); 
print (Current) 


5p 仿 ? 有 中 荫 ] 


Temp = Current + Last 


MysteryWrite (Current, Temp) 


修改 上 一 问题 中 的 函数 MysteryWrite， 使 
得 值 以 相反 的 顺序 打印 。 

如 果 用 二 分 搜索 算法 ( 见 图 5-14) 从 给 定 的 字 
寻 放 二 A B CeDeE EG Hs 1 TK 
L、M、N、0O 中 搜索 值 ]， 那 么 哪些 字母 会 被 
询问 到 ? 如 果 搜 索 值 Z 呢 ? 

在 对 一 个 有 6000 个 条 目的 列表 进行 许多 次 顺 
序 搜索 之 后 , 你 认为 目标 值 与 列表 条 目 进行 比 
较 的 平均 次 数 是 多 少 ? 如 果 搜 索 算 法 是 二 分 
搜索 呢 ? 

确定 下 列 每 个 迭代 语句 的 终止 条 件 。 


a. while (Count < 5) : 
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20: 
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31, 
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33; 


34. 


b. repeat: 


until (Count == 1) 
c. while ((Count < 5) and (Total < 56)): 


标识 下 列 循环 结构 的 循环 体 , 计算 它 将 执行 多 
少 次 。 如 果 把 测试 条 件 改 变 为 “(Count != 6)” 
会 怎样 ? 
Gaunt = 1 
while (Count != 7): 

print (Count) 

Count = Count + 3 


如 果 在 计算 机 上 实现 下 面 这 个 程序 ， 你 觉得 会 
发 生 什么 问题 ? (提示 : 记得 浮 点 运算 可 能 会 
导致 舍 入 误差 。) 
Count = one tenth 
repeat: 

print (Count) 

Count = Count + one tenth 

until (Count == 1) 


设计 一 个 递归 版 本 的 欧 几 里 得 算法 〈 见 5.2 节 
问题 与 练习 3 )。 
假设 Test1 和 Test2 (下 面 定 义 的 ) 的 输入 值 
都 为 1， 那 么 下 面 两 个 例 程 的 打印 结果 会 有 什 
么 不 同 ? 
def Testl (Count) : 
Count b= SY 
print (Count) 
Test1 (Count + 1) 
def Test2 (Count): 
if (Count l= 5): 
Test2 (Count + 1) 
print (Count) 


确定 上 一 题 中 的 例 程 的 控制 机 制 中 的 重要 组 
成 要 素 。 具体 而 言 , 什么 条 件 会 使 这 一 过 程 终 
止 ? 在 哪里 可 以 修改 过 程 状态 , 让 它 朝 着 终止 
条 件 变 化 ? 控制 过 程 状态 是 在 哪里 进行 的 初 
始 化 ? 
确定 下 面 递归 函数 的 终止 条 件 。 
def XXX (N) : 

if (N == 5): 

XXX(N + 1) 


用 值 3 调用 函数 MysteryPrint (下 面 定 义 
的 )， 记 录 打 印 的 值 。 


def MysteryPrint (N): 


if (N > 0): 
print (N) 
MysteryPrint (N - 2) 
print (N + 1) 


35. 用 值 2 调 用 函数 MysteryPrint (下 面 定义 
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的 )， 记 录 打 印 的 值 。 
def MysteryPrint (N): 
EAN > 9 
print (N) 
MysteryPrint(N - 2) 
else: 
print (N) 
i NN = 
MysteryPrint (N + 1) 


设计 一 个 算法 ，( 按 递增 顺序 ) 生成 其 素数 因 

子 为 2 和 3 的 正 整 数 的 序列 。 也 就 是 说 , 你 的 程 

序 应 该 产生 这 样 的 序列 : 2, 3, 4, 6, 8, 9, 12, 16， 

18, 24, 27，…。 在 严格 意义 上 讲 ， 你 的 程序 表 

示 的 是 一 个 算法 吗 ? 

按照 列表 Alice、Byron、Carol、Duane、Elaine、 

Floyd、Gene、Henry 和 Iris， 回 答 下 列 问 题 。 

a， 哪 种 搜索 算法 (顺序 或 二 分 能 更 快 找 到 
名 字 Gene? 

b. 哪 种 搜索 算法 (顺序 或 二 分 ) 能 更 快 找到 
名 字 Alice? 

c. 哪 种 搜索 算法 (顺序 或 二 分 ) 能 更 快 检测 
出 名 字 Bruce 不 存在 ? 

d. 哪 种 搜索 算法 (顺序 或 二 分 〉 能 更 快 检测 
出 名 字 Sue 不 存在 ? 

e. 在 用 顺序 搜索 算法 搜索 名 字 Elaine 时 ， 需 要 
询问 多 少 个 条 目 ? 用 二 分 搜索 呢 ? 

0 的 阶乘 定义 为 1。 正 整数 的 阶乘 定义 为 整数 本 

身 和 比 自己 小 的 非 负 整数 的 阶乘 。 我 们 用 符号 

il 来 表示 整数 zx 的 阶乘 。 于 是 3 的 阶乘 (写作 31) 

就 是 3X(20=3X(C2X(ID)=3X(2X(X 

(00)7)D)=3X(2X(LX(OD)F=6。 请 设计 一 个 递归 算 

法 来 计算 一 个 给 定 值 的 阶乘 。 


. a. 假设 你 必须 给 一 个 有 5 个 名 字 的 列表 排序 , 而 


且 你 已 经 设计 了 一 个 能 给 有 4 个 名 字 的 列表 
排序 的 算法 。 请 利用 已 经 设计 好 的 算法 来 设 
计 一 个 能 给 有 5 个 名 字 的 列表 排序 的 算法 。 

b. 基于 问题 a 中 使 用 的 技术 ， 设 计 一 个 能 给 任 
意 长 的 名 字 列 表 排 序 的 递归 算法 。 


. 称 为 汉 诺 塔 的 智力 游戏 有 3 根 柱 子 ， 每 个 柱子 


都 可 以 放置 若干 个 大 小 不 同 的 环 , 这 些 环 自 底 
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向 上 直径 越 来 越 小 。 这 个 问题 是 , 如 何 将 一 个 
柱子 上 排列 好 的 环 移 到 另 一 个 柱子 上 , 规则 是 
每 次 只 能 移动 一 个 环 , 较 大 的 环 不 能 放 在 较 小 
的 环 上 面 。 我 们 看 到 , 如 果 总 共 就 只 有 一 个 环 ， 
那么 问题 就 非常 容易 。 其次， 当 要 移 几 个 环 的 
时 候 , 如 果 你 把 除了 最 大 的 环 之 外 的 所 有 环 都 
搬 到 另 一 个 柱子 上 ， 那 么 就 可 以 把 这 个 最 大 的 
环 搬 到 第 三 根 柱子 上 ， 然 后 把 其 余 的 环 搬 到 它 
上 面 。 利 用 这 个 分 析 , 开发 一 个 递归 算法 来 解 
决 任意 环 数 的 汉 诺 塔 问题 。 


解决 汉 诺 塔 游戏 的 另外 一 个 方法 是 把 3 根 柱子 
想象 成 一 个 圆圈 排列 ， 每 根 柱 子 在 4 点 钟 、8 点 
钟 、12 点 钟 的 位 置 上 。 开 始 时 ， 一 根 柱子 上 的 
环 从 小 到 大 以 1, 2, 3 等 依次 编号 ， 最 小 的 环 编号 
为 1。 看 一 根 柱子 最 上 面 的 环 ， 如 果 它 的 编号 是 
奇数 ， 则 允许 它 按 照 顺 时 针 方 向 移 到 下 一 根 柱 
子 上 ; 同样 ， 如 果 它 的 编号 是 偶数 ， 则 允许 它 
按照 逆 时 针 方 向 移 到 下 一 根 柱 子 上 只 要 不 把 
较 大 的 环 放 在 较 小 的 环 的 上 面 )。 在 这 个 限制 条 
件 下 ， 当 几 个 柱子 上 有 可 搬 的 环 时 ， 总 是 搬 编 
号 最 大 的 环 。 按 照 这 个 思路 ， 开 发 一 个 非 递归 
算法 来 解决 汉 诺 塔 问题 。 
1 


2 


3 

开发 两 个 算法 ， 用 来 打印 一 个 工人 30 天 期 间 的 
日 薪 ， 要 求 一 个 算法 基于 循环 结构 ， 另 一 个 基 
于 递归 结构 。 这 个 工人 每 天 的 薪水 是 前 一 天 的 
两 倍 (第 一 天 的 薪水 设 为 1 便士 )。 如 果 在 实际 
的 机 器 上 实现 你 的 算法 ， 那 么 在 数 的 存储 上 面 
可 能 会 遇 到 什么 问题 ? 

设计 一 个 算法 来 求 一 个 正 数 的 平方 根 。 开 始 
时 ， 把 这 个 正 数 本 身 作为 根 的 第 一 个 猜测 值 ， 
以 后 按 下 列 方 法 重复 产生 新 的 猜测 值 : 原 正 数 
除 以 现在 的 猜测 值得 到 商 , 取 这 个 商 和 该 猜测 
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值 的 平均 值 作为 下 一 个 猜测 值 .分 析 对 这 个 重 
复 过 程 的 控制 , 特别 是 , 这 个 重复 过 程 的 终止 
条 件 应 该 是 什么 ? 
设计 一 个 算法 ， 列 出 一 个 由 5 个 不 同 字 符 组 成 
的 字符 串 中 的 字符 的 其 他 可 能 的 排列 。 
设计 一 个 算法 , 在 给 定 的 名 字 列 表 中 找到 最 长 
的 名 字 。 使 用 for 循 环 结构 。 如 果 列 表 里 有 多 
个 “最 长 ”的 名 字 ， 那么 算法 应 如 何 解 决 ? 特 
别 是 ， 如 果 列 表 里 的 所 有 名 字 的 长 度 都 一 样 ， 
算法 又 应 如 何 解 决 ? 
设计 一 个 算法 , 给 定 一 个 由 5 个 数 或 更 多 数组 成 
的 列表 ， 在 不 对 整个 列表 进行 排序 的 情况 下 ， 
在 列表 中 找 出 5 个 最 小 的 数 和 5 个 最 大 的 数 。 
对 名 字 Brenda、 Doris、 Raymond、 Steve、 Timothy 
和 William 进 行 排序 ， 要 求 在 使 用 插入 排序 算法 
〈 见 图 5-11) 进行 排序 时 比较 次 数 最 少 。 
对 于 有 4000 个 名 字 的 列表 , 使 用 二 分 搜索 算法 
( 见 图 5-14) 时 最 多 要 询问 多 少 个 条 目 ?使 用 
顺序 搜索 算法 〈 见 图 5-6) 呢 ? 试 对 二 者 进行 
比较 。 
使 用 大 @ 符 号 对 传统 的 小 学 加 法 和 乘法 的 算 
法 进行 分 类 。 也 就 是 说 ， 如 果 两 个 有 7 位 数字 
的 数 相 加 , 那么 要 做 多 少 次 一 位 的 加 法 ?如 果 
两 个 n 位 数字 的 数 相 乘 ， 那 么 要 做 多 少 次 一 位 
的 乘法 ? 
有 时 对 一 个 问题 稍 作 变 动 就 可 能 使 它 的 解 
的 形式 发 生 重大 改变 。 例如， 找到 一 个 简单 
的 算法 来 解决 下 述 问题 ， 并 用 大 @ 符 号 进行 
归 类 : 

把 一 群 人 分 为 两 个 不 相交 的 (任意 

大 小 的 ) 子 组 ， 使 得 两 个 子 组 成 员 

的 年 龄 的 总 和 的 差 尽 可 能 大 。 
现在 把 问题 改 为 ， 使 得 两 个 子 组 成 员 的 年 龄 的 
总 和 的 差 尽 可 能 小 ， 再 利用 大 @ 符 号 对 这 个 问 
题 的 方法 进行 归 类 。 
从 下 面 的 列表 中 找 出 一 组 数 ， 使 其 总 和 等 于 
3165。 你 的 方法 的 效率 如 何 ? 
26, 39, 104, 195, 403, 504, 793, 995, 1156, 1677 
下 面 例 程 中 的 循环 会 终止 吗 ? 请 解释 你 的 回 
答 。 如 果 把 这 个 例 程 放 到 计算 机 上 去 实际 执行 
〈 见 1.7 节 )， 可 能 会 发 生 什 么 情况 。 
XxX 于 
* 3 hs 
while (X != 0): 
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下 面 的 程序 段 是 用 来 计算 两 个 非 负 整数 X 和 Y 
的 乘积 的 ， 方 法 是 累加 X 个 Y 的 和 ; 也 就 是 说 ， 
3 乘 以 4 是 通过 累加 3 个 4 得 到 的 。 这 个 程序 段 正 
确 吗 ? 请 解释 你 的 回答 。 

Product = 0 

Count = 0 

repeat: 

Product + Y 
Count + 二 
until (Count == X) 


下 面 的 程序 段 是 用 来 报告 正 整数 X 和 Y 中 哪个 
大 的 ， 这 段 程序 正确 吗 ? 请 解释 你 的 回答 。 


4 
if (Difference is positive): 


Product = 
Count = 


Difference = 


print('X is bigger than Y') 
else: 


print('Y is bigger than X') 


下 面 的 程序 段 是 用 来 从 一 个 非 空 的 整数 列表 中 
找到 最 大 条 目的 。 这 个 程序 段 正确 吗 ? 请 解释 你 
的 回答 。 
TestValue = first list entry 
CurrentEntry = first list entry 
while (CurrentEntry is not the 
last entry): 
if (CurrentEntry > TestValue): 
TestValue = CurrentEntry 
CurrentEntry = the next list entry 


标识 图 5-6 表 示 的 顺序 搜索 算法 的 前 置 条 
件 。 为 这 个 程序 里 的 while 结 构 确 定 一 个 
循环 不 变 式 ， 当 它 与 终止 条 件 结合 时 ， 就 
意味 着 ， 在 该 循环 终止 时 该 算法 将 正确 地 
报告 成 功 或 失败 。 
b. 给 出 一 个 论据 说 明 图 5$-6 里 的 while 循 环 事 
实 上 是 会 终止 的 。 
基于 “ 赋 给 X 和 Y 的 值 是 非 负 整数 ”这 个 前 置 
条 件 ， 标 识 下 面 的 while 结 构 里 的 循环 不 变 
式 ， 当 它 与 终止 条 件 结合 时 ， 就 意味 着 ， 与 2 
相 联系 的 值 在 循环 终止 时 一 定 是 X-Y。 


2 = X 

可 = 0 

while (J < Y): 
"证 = 这 | 
可 全 本 


社会 问题 185 


OC > -一 一 一- 一 


社会 问题 


希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 道德 、 社 会 和 法 律 问题 。 回 答 出 这 

些 问 题 还 不 够 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

. 因为 现在 完全 验证 复杂 程序 的 正确 性 几乎 是 不 可 能 的 ， 所 以 在 何 种 情况 下 《〈 如 果 有 这 种 
情况 )， 程 序 的 创建 者 对 错误 都 负 有 责任 ? 

2. 假设 你 有 一 个 想法 ， 并 把 它 开 发 成 了 一 个 为 很 多 人 所 用 的 产品 ， 而 这 已 经 耗费 了 你 一 年 的 
时 间 和 50 000 美 元 的 投资 。 可 是 ， 该 产品 的 最 终 形 式 可 能 被 大 多 数 没有 向 你 购买 该 产品 的 
人 所 使 用 。 为 了 获得 补偿 你 具有 哪些 权利 ? 盗版 计算 机 软件 道德 吗 ? 音乐 和 运动 图 像 呢 ? 

. 假设 一 个 软件 包 非 常 昂贵 , 超出 了 你 的 预算 , 那么 复制 这 个 软件 供 自己 使 用 道德 吗 ? 〈 毕 竟 ， 
因为 你 无 论 如 何 都 不 可 能 去 购买 这 个 软件 包 ， 所 以 对 供应 商 的 销售 额 不 会 有 影响 。) 

. 人 们 对 河流 、 森 林 、 海 洋 等 的 所 有 权 一 直 争 论 不 休 ， 那 么 在 什么 意义 上 应 该 给 某 人 或 某 
机 构 一 个 算法 的 所 有 权 ? 

. 有 些 人 觉得 新 算法 是 被 发 现 的 ， 而 另 一 些 则 觉得 新 算法 是 被 创建 的 。 你 同意 哪 种 说 法 ? 
这 些 不 同 观 点 会 导致 关于 算法 的 所 有 权 和 一 般 所 有 权 的 不 同 结论 吗 ? 

. 设计 一 个 实现 非法 行为 的 算法 是 道德 的 吗 ? 它 与 该 算法 是 否 被 实际 执行 有 关 吗 ? 开发 出 这 种 
算法 的 人 应 该 具有 该 算法 的 所 有 权 吗 ? 如 果 具 有 , 应 该 拥有 哪些 权利 ? 算法 的 所 有 权 应 该 与 该 
算法 的 目的 有 关 吗 ?大肆 宣 扬 和 散布 破解 安全 的 技术 是 道德 的 吗 ? 它 与 破解 的 内 容 有 关 吗 ? 

. 一 个 作家 会 获得 为 一 部 小 说 支付 的 运动 图 像 版 权 费 ， 尽 管 这 个 故事 在 电影 版 本 中 经 常 被 
改动 。 一 个 故事 要 改变 成 一 个 不 同 的 故事 ， 它 必须 改变 多 少 呢 ? 对 于 算法 来 说 ， 一 个 算 
法 要 变 成 一 个 不 同 的 算法 ， 必 须要 对 这 个 算法 做 多 少 改动 呢 ? 

. 面向 18 个 月 或 更 小 儿童 的 教育 软件 现在 正在 销售 。 支 持 者 认为 ， 这 些 软件 提供 的 视界 和 
声音 是 许多 孩子 无 法 通过 其 他 途径 获得 的 ;反对 者 认为 ， 它 是 父母 与 子女 之 间 交 流 的 拙 
劣 的 替代 品 。 你 有 什么 看 法 ? 你 应 该 在 没有 对 这 个 软件 了 解 更 多 的 情况 下 采取 行动 吗 ? 
如 果 是 ， 你 会 怎么 做 ? 
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程序 设计 语言 


章 我 们 来 学 习 程序 设计 语言 。 我 们 将 继续 在 合适 的 地 方 使 用 Pythen 示 例 ， 但 是 我 们 
的 目标 不 是 专注 于 某 一 门 特定 的 程序 设计 语言 ， 而 是 学 习 与 程序 设计 语言 相关 的 一 
些 知识 。 我 们 要 了 解 程序 设计 语言 及 其 相关 联 的 方法 之 间 的 共性 和 个 性 。 


本 章 内 容 

6.1 历史 回顾 ”6.5 面向 对 象 程序 设计 
6.2 传统 的 程序 设计 概念 *#6.6 ”程序 设计 并 发 活动 
6.3 过 程 单元 #6.7 ”说 明 性 程序 设计 


6.4 语言 实现 


如 果 人 们 被 迫使 用 机 器 语言 直接 编写 程序 ， 很 可 能 就 无 法 开发 出 复杂 的 软件 系统 ， 如 操作 
系统 、 网 络 软件 和 当今 可 用 的 大 量 应 用 软件 。 我 们 至 少 可 以 这 么 说 ， 在 试图 组 织 复杂 系统 的 同 
时 ， 处 理 这 些 与 机 器 语言 有 关 的 错综复杂 的 细节 必定 是 一 项 繁重 的 工作 。 

因此 ， 人 们 开发 出 了 许多 程序 设计 语言 ， 使 得 算法 的 表达 既 便 于 人 理解 ， 又 便于 转换 为 机 
器 语言 指令 。 本 章 的 目标 是 探究 计算 机 科学 领域 内 的 这 些 语 言 的 设计 和 实现 的 处 理 。 


rn 


6.1 历史 回顾 

我 们 从 追溯 程序 设计 语言 的 历史 发 展开 始 。 
6.1.1 早期 程序 设计 语言 

正如 在 第 2 章 学 过 的 ， 现 代 计算 机 的 程序 由 采用 数字 编码 的 指令 序列 组 成 。 这 样 的 编码 系统 
称 为 机 器 语言 。 但 是 ， 用 机 器 语言 编写 程序 是 一 项 兄长 乏味 的 任务 ， 而 且 经 常 出 错 ， 在 工作 完 
成 之 前 ， 这 些 错误 必须 被 找到 并 更 正 这 个 过 程 称 为 调试 (debugging)。 

20 世 纪 40 年 代 ， 研 究 人 员 为 了 简化 程序 设计 过 程 开 发 了 计数 制 系统 ， 使 得 指令 可 以 用 助 记 
符 表 示 ， 不 用 使 用 数字 形式 表示 。 例 如 ， 指 令 

把 寄存 器 5 的 内 容 移动 到 寄存 器 6 
可 用 第 2 章 介绍 的 机 器 语言 表示 为 

4056 
而 使 用 助 记 符 系 统 时 ， 可 以 表示 为 


MOV R53, Ré6 
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再 举 一 个 更 大 一 点 的 例子 ， 机 器 语言 例 程 

156C 

166D 

5056 

306E 

C000 
将 存储 单元 6C 和 6D 的 内 容 相 加 ， 将 结果 存储 在 地 址 6E〈 见 2.2 节 图 2-7〉 中 ， 可 以 使 用 助 记 符 表 
达 为 : 

LD R5, Price 

LD R6, ShippingCharge 

ADDI RO, R5 R6 

ST ARO; TotadCost 

HLT 
[这 里 ， 我 们 使 用 LD、ADDI、ST 和 HLT 分 别 表示 加 载 、 相 加 、 存 储 和 停止 。 此 外 ， 我 们 使 用 描 
述 性 名 称 Price、Shippingcharge 和 TotalCost 分 别 指 代 地 址 为 6C、6D 和 6E 的 存储 单元 ， 这 
些 描述 性 的 名 称 常 称 为 程序 变量 或 标识 符 (identifier)。] 注意 ， 助 记 符 形式 虽然 有 不 足 之 处 ， 
但 是 与 数字 形式 相 比 ， 它 确实 能 更 好 地 表达 例 程 含义 。 
建立 起 这 种 助 记 符 系 统 后 ， 人 们 就 开发 了 称 为 汇编 器 (assembler〉 的 程序 ， 用 来 将 助 记 符 表达 
式 转换 为 机 器 语言 指令 。 以 此 方式 ， 人 们 可 以 使 用 助 记 符 的 形式 开发 程序 ， 然 后 再 用 汇编 器 把 
它 转 换 为 机 器 语言 ， 而 不 必 直 接 使 用 机 器 语言 开发 程序 。 
表示 程序 的 助 记 符 系统 统称 为 汇编 语言 assembly language)。 当 汇编 语言 最 初 被 开发 出 来 时 ， 
它们 代表 了 在 研究 更 好 的 程序 设计 技术 方面 迈 出 了 巨大 一 步 。 实 际 上 ， 汇 编 语言 的 出 现 是 革命 
性 的 事件 ， 以 至 于 它们 被 称 为 第 二 代 程 序 设 计 语 言 ， 而 第 一 代 程 序 语言 是 机 器 语言 本 身 。 

尽管 汇编 语言 与 它们 对 应 的 机 器 语言 相 比 有 不 少 的 优势 ， 但 是 仍 有 一 些 不 足 一 一 它们 没有 
提供 最 终 的 程序 设计 环境 。 毕 竞 ， 在 汇编 语言 中 使 用 的 原 语 本 质 上 和 与 之 相对 应 的 机 器 语言 中 的 
相同 ， 这 两 者 的 不 同 仅仅 体现 在 用 于 表示 它们 的 语法 上 。 因 此 ， 用 汇编 语言 写 的 程序 必然 依赖 于 
机 器 ， 也 就 是 说 ， 程 序 中 使 用 的 指令 都 是 遵循 特定 的 机 器 特性 来 编写 的 。 反 过 来 ， 用 汇编 语言 写 
的 程序 不 能 被 简单 地 移植 到 另 一 种 机 器 设计 上 ， 因 为 这 个 程序 必须 重 写 才 能 遵循 新 计算 机 的 寄存 
器 配置 和 指令 集 。 

汇编 语言 的 另 一 个 缺点 是 ， 尽 管 程序 员 不 再 必须 使 用 数字 形式 对 指令 进行 编码 ， 但 仍 不 得 
不 从 机 器 语言 的 角度 一 小 步 一 小 步 地 思考 。 这 种 情况 很 类 似 于 房屋 设计 一 一 我 们 毕竟 还 是 要 根 
据 木 板 、 钉 子 和 砖 块 等 来 设计 。 确 实 ， 在 实际 的 房屋 建造 中 ， 最 后 的 确 还 需要 一 个 基于 这 些 基 
本 元 素 的 描述 ， 但 是 如 果 我 们 根据 诸如 房间 、 窗 户 和 门 等 更 大 一 些 的 单元 来 思考 设计 ， 设 计 过 
程 应 该 会 更 容易 一 些 。 

简 而 言 之 ， 最 终 构建 产品 所 使 用 的 基本 原 语 不 一 定 是 在 产品 设计 过 程 中 使 用 的 原 语 。 这 个 
设计 过 程 应 该 更 适合 使 用 高 级 原 语 一 一 每 一 个 原 语 都 代表 了 一 个 与 产品 的 主要 特性 相关 的 概 
念 。 一 旦 设计 过 程 结束 ， 这 些 原 语 就 能 够 被 翻译 成 与 实现 细节 相关 的 较 低级 概念 。 

根据 这 种 哲理 , 计算 机 科学 家 开始 开发 比 低级 的 汇编 语言 更 易于 开发 软件 的 程序 设计 语言 。 
结果 就 出 现 了 第 三 代 程序 设计 语言 , 它们 与 前 两 代 程序 设计 语言 的 不 同 之 处 在 于 , 它们 的 原 语 不 仅 
级 别 更 高 (它们 所 能 表达 的 指令 有 较 大 幅度 的 增加 )， 而 且 都 是 机 器 无 关 (machine independent) 的 
(它们 不 依赖 于 特定 机 器 的 特性 )。 最 著名 的 早期 例子 是 FORTRAN (全 称 为 FORmula TRANslator) 
和 COBOL (全 称 为 COmmon Business-Oriented Language); 前 者 是 为 科学 和 工程 应 用 开发 的 ; 
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后 者 是 由 美国 海军 为 商业 应 用 开发 的 。 

一 般 来 说 ， 第 三 代 程 序 设计 语言 的 方法 就 是 标识 一 个 高 级 原 语 集 合 〈( 基 本 上 和 我 们 在 第 5 
章 中 开发 伪 代 码 的 思路 一 致 ), 而 软件 要 使 用 这 些 原 语 来 开发 。 每 一 个 原 语 都 要 能 够 实现 为 一 个 
机 器 语言 可 用 的 低级 原 语序 列 。 例 如 ， 语 句 

把 Price + ShippingCharge 的 值 赋 给 TotalCost 
描述 了 一 个 高 级 的 活动 ， 它 并 不 与 执行 此 任务 的 特定 机 器 相关 ， 但 它 可 以 由 先前 讨论 过 的 机 器 
指令 序列 来 实现 。 因 此 ， 我 们 的 伪 代 码 结构 

标识 符 = 表达 式 
是 潜在 的 高 级 原 语 。 

一 旦 这 样 的 高 级 原 语 集合 被 标识 出 来 ， 就 可 以 编写 出 一 个 称 作 翻 译 器 (translator〉 的 程序 ， 
这 个 程序 能 够 把 用 高 级 原 语 表示 的 程序 翻译 成 机 器 语言 程序 。 除 了 常常 将 一 些 机 器 指令 编译 为 
短 序列 来 模拟 一 个 高 级 原 语 所 请 求实 现 的 活动 ， 翻译 器 很 类 似 于 第 二 - 代 语 言 的 汇编 器 。 因 此 ， 
这 些 翻译 程序 通常 也 称 为 编译 器 (compiler )。 

翻译 器 的 一 种 替代 方案 是 解释 器 〈interpreter)， 它 是 作为 实现 第 三 代 程 序 设计 语言 的 另 一 
种 方法 出 现 的。 这 些 程序 类 似 于 翻译 器 ， 不 同 之 处 是 ， 它 们 在 翻译 出 指令 的 同时 执行 指令 ， 而 
不 是 把 翻译 出 的 指令 记录 下 来 供 将 来 使 用 。 也 就 是 说 ， 解 释 器 不 产生 供 以 后 执行 使 用 的 程序 的 
机 器 语言 副本 ， 而 是 依据 程序 的 高 级 形式 实际 执行 它 

另 一 个 枝 节 问题 是 ， 我 们 应 当 注 意 到 发 展 第 三 - 代 程序 设计 语言 的 任务 并 没有 想象 得 那么 简 
单 。 使 用 类 似 于 自然 语言 的 形式 来 编写 程序 的 思想 是 革命 性 的 ， 以 至 于 首先 在 许多 管理 部 门人 
员 中 引起 了 争论 。Grace Hopper 是 公认 的 第 一 个 编译 器 的 开发 者 ， 她 常常 讲 这 样 的 故事 ， 她 在 
演示 第 三 代 语 言 的 翻译 器 时 ， 使 用 的 是 德 文 词汇 ， 而 不 是 英文 词汇 。 关 键 是 ， 程 序 设计 语言 是 
围绕 一 小 组 原 语 来 构造 的 ， 而 这 些 原 语 可 以 用 各 种 各 样 的 自然 语言 来 表达 ， 只 需要 稍微 修改 一 
下 翻译 器 。 但 是 ， 她 惊讶 地 发 现 ， 许 多 听众 对 于 她 在 第 二 次 世界 大 战 前 后 的 几 年 里 一 直 在 教 计 
算 机 “理解 ”德语 感到 震惊 。 今 天 ， 我 们 知道 理解 一 门 自然 语言 涉及 的 问题 远 远 超过 对 不 多 几 
条 严格 定义 的 原 语 的 响应 。 的 确 ， 自 然 语言 (natural language， 如 英语 、 德 语 和 拉丁 语 ) 不 同 
于 形式 语言 (formal language， 如 程序 设计 语言 )， 后 者 是 由 语法 严格 定义 的 〈 见 6.4 节 )， 而 前 
者 还 远 远 没有 涉及 形式 语法 分 析 。 





”典型 的 应 用 程序 必须 依赖 操作 系统 来 完成 它 的 许多 任务 。 gr 
的 服务 与 计算 机 用 户 进行 交互 ; 也 许 需 要 利用 文件 管理 程序 从 海量 存储 器 中 检索 数据 . 但 是 ， 
不 同 的 操作 系统 可 能 要 求 以 不 同 的 方式 请 求 这 此 服务。 这样 一 来 ， 对 于 需要 跨 网 络 和 互联 网 
来 传输 和 执行 的 程序 而 言 ， 网 络 和 互联 网 涉及 各 种 不 同 的 机 器 设计 和 不 同 的 操作 系统 ， 因 此 
程序 必须 要 做 到 与 操作 系统 无 关 ， 同 时 与 机 器 无 关 .“ 跨 平台 ”这 个 术语 用 于 反映 这 种 额外 的 
独立 程度 。 也 就 是 说 ， 跨 平台 软件 是 一 个 可 以 独立 于 操作 系统 设计 和 具体 机 器 硬件 设计 的 软 
件 ， 因 此 在 整个 网 络 上 都 是 可 执行 的 。 


6.1.2 ”机 器 无 关 和 超越 机 器 无 关 


随 着 第 三 代 程 序 设 计 语 言 的 开发 ， 机 器 无 关 的 目标 在 很 大 程度 上 实现 了 。 由 于 第 三 代 语 言 
中 的 语句 不 再 与 任何 特定 机 器 的 特性 有 关 ， 因 此 它们 能 够 在 不 同 的 机 器 上 被 轻松 编译 。 通 过 使 
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用 合适 的 编译 器 ， 一 个 用 第 三 代 语言 编写 的 程序 理论 上 应 该 能 够 在 任何 机 器 上 使 用 。 

但 是 ， 现 实证 明 并 不 是 这 么 简单 。 在 设计 编译 器 时 ， 底 层 机 器 的 具体 特征 有 时 候 会 作为 要 
翻译 的 语言 的 条 件 反映 出 来 。 例 如， 不 同 的 机 器 处 理 1/O 操 作 有 不 同 的 方法 ， 这 在 历史 上 导致 了 
“相同 的 ”语言 在 不 同 的 机 器 上 有 着 不 同 的 特征 或 方言 。 因 此 ， 对 于 一 个 程序 而 言 ， 从 一 台 机 器 
移植 到 另 一 台 机 器 通常 多 少 都 要 做 些 修改 。 

伴随 可 移植 性 问题 而 来 的 是 ， 对 在 某 些 情况 下 关于 特定 语言 的 正确 定义 应 该 包括 哪些 东西 
缺乏 一 致 性 的 认识 。 为 此 ， 美 国 国家 标准 化 学 会 (ANSI) 和 国际 标准 化 组 织 〈ISO) 正式 通过 
并 公布 了 许多 流行 语言 的 标准 。 除 此 之 外 ， 出 于 某 种 语言 的 某 个 方言 的 流行 以 及 其 他 编译 器 的 
作者 生产 兼容 产品 的 意愿 ， 还 制定 了 一 些 非 正式 的 标准 。 但 是 ， 即 使 是 高 度 标准 化 了 的 语言 ， 
编译 器 的 设计 者 通常 还 是 会 提供 一 些 不 包括 在 标准 版 本 之 中 的 特性 ， 这 些 特性 有 时 也 被 称 为 语 
言 扩展 。 如 果 一 个 程序 员 利 用 这 些 特性 ， 那 么 他 设计 出 来 的 程序 就 不 能 兼容 采用 其 他 厂商 编译 
器 的 环境 。 

在 程序 设计 语言 的 整个 历史 中 ， 由 于 以 下 两 个 原因 ， 第 三 代 语 言 没 有 真正 达到 机 器 无 关 这 
个 事实 并 不 重要 。 第 一 ， 它 们 已 经 几乎 达到 了 机 器 无 关 性 ， 软 件 可 以 从 一 台 机 器 相对 比较 容易 
地 移植 到 另 一 台 机 器 。 第 二 ， 机 器 无 关 的 目标 仅仅 是 其 他 更 高 目标 的 一 个 基础 。 确 实 ， 机 器 能 
够 响应 像 

把 Price + ShippingCharge 的 值 赋 给 TotalCost 
这 样 的 高 级 语句 ， 这 种 现实 致使 计算 机 科学 家 们 梦想 实现 这 样 的 程序 设计 环境 ， 它 允许 人 们 用 
抽象 的 概念 与 机 器 进行 交互 ， 而 不 再 强迫 机 器 把 这 些 概念 翻译 成 与 机 器 兼容 的 格式 。 此 外 ， 计 
算 机 科学 家 更 希望 机 器 能 够 实现 许多 算法 发 现 过 程 ， 而 不 是 仅仅 能 够 执行 算法 。 结 果 带 来 程序 
设计 语言 谱系 的 不 断 扩大 ， 以 至 于 按照 不 同 世代 的 清晰 划分 受到 挑战 。 


6.1.3 程序 设计 范 型 


程序 设计 语言 是 基于 一 个 线性 尺度 〈 见 图 6-1) 划分 为 不 同 世代 的 ， 在 这 个 线性 尺度 上 ， 语 
言 的 定位 是 由 这 个 语言 的 使 用 者 不 受 机 器 语言 世界 约束 的 程度 ， 以 及 允许 从 解决 问题 的 角度 来 
进行 思考 的 程度 决定 的 。 实 际 上 ， 程 序 设计 语言 并 不 是 严格 遵照 这 种 划分 方式 发 展 的 ， 而 是 沿 
着 不 同 的 路 径 发 展 成 了 已 经 浮 出 水 面 并 受 追 捧 的 程序 设计 过 程 【 称 为 程序 设计 范 型 
(programming paradigm)] 的 替代 方法 。 因 此 ， 图 6-2 所 示 的 多 轨迹 图 能 更 好 地 描述 程序 设计 语 
言 的 发 展 历程 ， 该 图 显示 了 来 源 于 不 同 范 型 的 不 同 路 径 的 出 现 和 发 展 。 具 体 地 说 ， 这 幅 图 展示 
了 4 条 路 径 ， 分 别 代表 了 函数 式 范 型 、 面 向 对 象 范 型 、 命 令 型 范 型 和 说 明 性 范 型 ， 图 中 通过 与 其 
他 语言 相对 位 置 的 关系 , 指出 了 与 每 一 个 范 型 联系 的 各 种 语言 的 诞生 时 间 。( 但 是 这 并 不 意味 着 
一 种 语言 必然 是 从 一 种 早期 语言 中 发 展 而 来 的 。) 


问题 在 人 必须 顺应 机 器 问题 在 机 器 顺应 人 的 
特征 的 环境 里 被 解决 特征 的 环境 里 被 解决 


3 


第 一 代 第 三 代 ”第 三 代 ”第 四 代 
图 6-1 程序 设计 语言 的 世代 
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图 6-2 程序 设计 范 型 的 演变 

我 们 应 当 注 意 到 , 尽管 图 6-2 中 标识 的 范 型 称 为 程序 设计 范 型 ， 然 而 对 不 同 的 分 文 〈 即 路 线 ) 
的 选择 已 经 超出 了 程序 设计 过 程 的 范畴 。 它 们 基本 上 代表 了 构建 问题 解决 方案 的 不 同方 法 ， 并 
且 因 此 影响 整个 软件 开发 过 程 。 在 这 种 意义 上 ， 程 序 设计 范 型 这 个 术语 有 些 使 用 不 当 ， 一 个 更 
现实 的 术语 应 该 是 软件 开发 范 型 。 

令 型 范 型 (imperative paradigm) 也 叫 过 程 范 型 (procedural paradigm)， 代 表 了 程序 设计 
过 程 的 传统 方法 。 命 令 型 范 型 就 是 Python、 第 5 章 中 的 伪 代 码 以 及 第 2 章 讨论 的 机 器 语言 所 基于 
的 范 型 。 正 如 它 的 名 字 所 上 暗示 的 那样 ， 命 令 型 范 型 定义 的 程序 设计 过 程 是 开发 一 个 命令 序列 ， 
遵照 这 个 序列 ， 对 数据 进行 操作 以 产生 所 期 望 的 结果 。 因 此 命令 型 范 型 告诉 我 们 ， 要 处 理 程序 
设计 过 程 ， 首 先 要 找到 解决 手头 问题 的 算法 ， 然 后 将 这 个 算法 表示 为 一 个 命令 序列 。 

与 命令 型 范 型 相对 的 是 说 明 性 范 型 (declarative paradigm)， 它 要 求 程 序 员 描述 的 是 要 解决 
的 问题 ， 而 不 是 要 遵循 的 算法 。 更 准确 地 说 ， 说 明 性 程序 设计 系统 是 应 用 预先 设 定 的 解决 问题 
的 通用 算法 来 解决 面临 的 问题 的 。 在 这 种 环境 下 ， 程 序 员 的 任务 变 成 了 开发 问题 的 准确 陈述 ， 
而 不 是 描述 一 个 解决 问题 的 算法 。 

在 开发 基于 说 明 性 范 型 的 程序 设计 系统 时 ， 一 个 主要 的 障碍 就 是 需要 一 个 潜在 的 解决 问题 
的 算法 。 正 因为 这 样 ， 早 期 的 说 明 性 程序 设计 语言 本 质 上 倾向 于 特定 的 用 途 ， 专 为 特殊 应 用 设 
计 。 例 如 ， 许 多 年 以 来 ， 说 明 性 方法 一 直 用 于 模拟 一 个 系统 (政治 的 、 经 济 的 、 环 境 的 等 等 ) 
来 判定 假设 或 获得 预测 。 在 这 些 情况 下 ， 潜 在 的 算法 本 质 上 是 通过 重复 计算 参数 的 值 (国内 生 
产 总 值 、 贸 易 赤 字 等 ) 来 模拟 时 间 推 移 的 过 程 ， 其 中 所 用 的 参数 都 基于 以 前 计算 得 到 的 值 。 于 
是 ， 用 于 这 类 模拟 的 说 明 性 语言 需要 首先 实现 一 个 执行 该 重复 函数 的 算法 。 然 后 ， 使 用 这 个 系 
统 的 程序 员 唯 一 的 任务 就 是 描述 要 模拟 的 情况 。 按 照 这 种 方法 ， 天 气 预报 员 不 必 开 发 一 个 预报 
天 气 的 算法 ， 只 需要 描述 当前 的 天 气 情况 ， 让 洪 在 的 模拟 算法 来 产生 未 来 几 天 的 天 气 预报 。 

人 们 发 现 ， 数 学 里 的 形式 逻辑 学 科 提 供 了 一 种 简单 的 、 适 用 于 通用 说 明 性 程序 设计 系统 的 
问题 求解 算法 ， 这 极 大 地 促进 了 说 明 性 范 型 的 发 展 。 其 结果 是 人 们 更 加 关注 说 明 性 范 型 ， 并 且 
出 现 了 逻辑 程序 设计 (logic programming)， 这 是 6.7 节 要 讨论 的 主题 。 

另 一 种 程序 设计 范 型 是 函数 式 范 型 (functional paradigm), 基于 该 范 型 的 程序 可 以 看 作 是 接 
受 输入 和 产生 输出 的 实体 。 数 学 家 将 这 样 的 实体 称 为 函数 ， 这 就 是 这 种 范 型 被 称 为 函数 式 范 型 
的 原因 。 函 数 式 范 型 的 程序 是 通过 连接 较 小 的 预定 义 程序 单元 (预定 义 函 数 ) 来 构建 的 ， 其 中 
每 一 个 程序 单元 的 输出 都 可 以 用 作 另 一 个 程序 单元 的 输入 ， 通 过 这 种 方式 可 以 获得 所 期 望 的 整 
体 上 的 输入 -输出 关系 。 简 而 言 之 , 这 种 函数 式 范 型 的 程序 设计 过 程 就 是 把 函数 构造 成 较 简单 的 
函数 的 峰 套 联合 体 。 

举 一 个 例子 ， 图 6-3 说 明了 如 何 由 两 个 较 简 单 的 函数 构成 一 个 计算 文 票 秒 余 额 的 函数 。 其 中 
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一 个 称 为 Find_sum， 它 接收 一 些 值 作为 输入 ， 产 生 这 些 值 的 和 作为 输出 ; 另 一 个 称 为 
Find qdiff， 它 接收 两 个 值 ， 计 算 它们 的 差 。 使 用 LISP 程 序 设 计 语 言 (一 个 著名 的 函数 式 程序 
设计 语言 ) 时 ， 图 6-3 所 示 的 结构 可 以 用 下 列表 达 式 表示 : 

(Find diff (Find sum Old balance Credits) (Find sum Debits) ) 


该 表达 式 的 这 个 骨 套 结构 〈 如 括号 中 指定 的 ) 反映 了 这 样 一 个 事实 : 函数 Find_diff 的 输入 是 
由 Fina sum 的 两 次 应 用 产生 的 。Fingd _ sum 的 第 一 次 应 用 是 计算 所 有 Credits 加 01lq balance 
的 结果 ， 第 二 次 应 用 是 计算 所 有 Debits 的 总 和 。 然 后 ， 函 数 Finq_ diff 使 用 这 两 个 结果 计算 新 
的 支票 余额 。 





= 


图 6-3 ”由 较 简 单 的 函数 构造 支票 簿 余额 计算 函数 


为 了 更 全 面 地 理解 函数 式 范 型 与 命令 型 范 型 之 间 的 区 别 ， 我 们 把 求 支 票 秒 余 额 的 函数 式 程 
序 同 下 面 遵 循 命令 型 范 型 的 伪 代 码 程序 进行 一 下 比较 : 

Total_credits = 所 有 Credits 的 总 和 

Temp_balance = Old balance + Total credits 

Total debits = 所 有 Debits 的 总 和 

Balance = Temp balance - Total debits 
注意 ， 这 个 命令 型 程序 由 多 条 语句 组 成 ， 每 条 语句 都 要 求 执 行 计算 ， 并 请 求 把 这 个 结果 存储 起 
来 供 以 后 使 用 。 与 命令 型 程序 不 同 ， 函 数 式 程序 由 单个 语句 组 成 ， 程 序 中 的 每 个 计算 结果 都 会 
立即 传送 给 下 一 个 函数 式 程 序 。 从 某 种 意义 上 说 ， 命 令 型 程序 可 以 看 作 是 若干 工厂 的 集合 ， 每 
个 工厂 都 把 原材料 生产 成 产品 ， 并 把 这 些 产 品 存 放 在 仓库 里 。 然 后 ， 产 品 从 这 些 仓库 被 装运 到 
其 他 需要 这 些 产品 的 工厂 。 虽 然 函数 式 程序 也 可 以 看 作 是 若干 工厂 的 集合 ， 但 是 这 些 工 厂 是 协 
调 工作 的 ， 每 个 工厂 仅仅 生产 其 他 工厂 订购 的 产品 ， 然 后 立刻 把 这 些 产品 运送 到 目的 地 而 不 需 
要 中 间 存 储 。 这 种 效率 也 是 函数 式 范 型 的 支持 者 声明 的 优点 之 一 。 

男 一 种 程序 设计 范 型 (当今 软件 开发 领域 中 最 著名 的 一 个 ) 是 面向 对 象 范 型 (object-oriented 
paradigm)， 它 是 与 称 为 面向 对 象 程序 设计 (Object-Oriented Programming，OOP) 的 程序 设计 过 
程 相 联系 的 。 遵 照 该 范 型 设计 的 软件 系统 被 看 作 是 一 个 对 象 “object) 的 集合 ， 每 一 个 对 象 都 能 够 
执行 与 自己 直接 相关 的 动作 以 及 其 他 对 象 请 求 的 动作 。 总之, 这些 对 象 通过 交互 解决 手头 的 问题 。 
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再 举 一 个 面向 对 象 方法 的 例子 ， 考 虑 一 个 开发 图 形 用 户 界面 的 任务 。 在 面向 对 象 环境 中 ， 
屏幕 上 的 图 标 将 作为 对 象 来 实现 。 每 个 对 象 包含 一 个 函数 集合 [在 面向 对 象 环 境 中 称 为 方法 
(method) ]， 用 于 描述 对 象 是 如 何 响 应 各 种 事件 的 发 生 的 ， 诸 如 被 鼠标 单 击 选中 或 者 是 被 鼠标 
在 屏幕 上 拖 动 等 。 因 此 ， 整 个 系统 可 以 看 作 是 由 一 个 对 象 的 集合 构建 的 ， 每 一 个 对 象 都 知道 如 
何 响应 与 之 有 关 的 事件 。 

为 了 比较 命令 型 范 型 与 面向 对 象 范 型 ， 这 里 考虑 一 个 涉及 名 字 列 表 的 程序 。 在 传统 的 命令 
型 范 型 中 ， 这 个 列表 仅仅 是 一 个 数据 的 集合 ， 任 何 一 个 访问 这 个 列表 的 程序 都 必须 包含 执行 所 
需 操作 的 算法 。 然 而 ， 在 面向 对 象 方法 中 ， 这 个 列表 将 被 构建 成 由 列表 和 操作 这 个 列表 的 方法 
的 集合 组 成 的 对 象 。( 这 可 能 包括 向 列表 中 插入 新 条 目的 函数 、 从 列表 中 删除 条 目的 函数 、 检 测 
列表 是 否 为 空 的 函数 ， 以 及 对 列表 排序 的 函数 。) 因此 ,另外 一 个 需要 操作 这 个 列表 的 程序 单元 
不 再 包含 执行 这 些 任 务 的 算法 ， 而 是 要 利用 这 个 对 象 中 提供 的 函数 。 从 某 种 意义 上 说 ， ee 
元 要 求 列表 自己 把 自己 排 好 序 ， 而 不 是 像 在 命令 型 范 型 中 那样 由 程序 单元 对 列表 排序 。 尽 管 我 
们 将 要 在 6.5 节 更 详细 地 讨论 面向 对 象 范 型 ， 但 面向 对 象 范 型 在 当今 
我 们 在 这 里 引入 类 的 概念 。 为 此 ， 我 们 回顾 一 下 ， 一 个 对 象 可 以 包含 数据 〈 如 名 字 列 表 )， 同 时 
包含 完成 活动 《如 在 列表 中 插入 新 的 名 字 ) 的 方法 的 集合 。 这 些 特性 必须 通过 所 写 的 程序 中 的 

语句 来 描述 。 对 象 的 属性 的 这 个 描述 称 为 类 (class)。 一 旦 一 个 类 被 构造 好 了 ， 它 就 可 以 在 任何 
需要 具有 这 些 特征 的 对 象 的 时 候 被 使 用 。 因此 ， 几 个 对 象 可 以 基于 同一 个 类 《〈 即 由 同一 个 类 构 
建 )。 就 像 同 卵 双胞胎 一 样 ， 由 于 这 些 对 象 产生 于 相同 的 模板 《相同 的 类 )， 它 们 虽然 具有 相同 
特征 但 却 是 不 同 的 实体 。 基 于 特定 的 类 构建 的 对 象 称 为 这 个 类 的 实例 (instance )。 

由 于 对 象 是 明确 定义 的 单元 ， 在 可 重用 的 类 中 ， 其 描述 是 孤立 的 ， 所 以 面向 对 象 范 型 受到 
了 欢迎 。 进 而 ， 面 向 对 象 程序 设计 的 支持 者 指出 面向 对 象 范 型 为 软件 开发 的 “构建 块 ” 方 法 提 
供 了 一 个 自然 的 环境 。 他 们 设想 了 预定 义 的 类 的 软件 库 ， 通 过 这 个 库 ， 新 的 软件 系统 能 够 像 许 
多 传统 的 产品 构建 于 现成 的 组 件 一 样 构建 出 来 。 构 建 和 扩展 这 样 的 库 是 一 个 持续 的 过 程 ， 我 们 
将 在 第 7 章 学 习 到 。 

最 后 ， 我 们 应 该 注意 到 ， 包 含 在 一 个 对 象 内 的 方法 实质 上 是 一 些小 的 命令 型 程序 单元 。 这 
就 意味 着 ， 大 多 数 基于 面向 对 象 范 型 的 程序 设计 语言 都 包含 许多 可 以 在 命令 型 语言 中 找到 的 特 
性 。 例 如 ， 当 前 流行 的 面向 对 象 语言 C++ 就 是 通过 在 C 语 言 这 个 命令 型 语言 中 添加 一 些 面向 对 象 
的 特性 开发 出 来 的 。 此 外 ， 从 C++ 派生 出 来 的 Java 和 C# 也 都 继承 了 命令 型 语言 的 精 苯 。 在 6.2 节 
和 6.3 节 ， 我 们 将 探究 命令 型 语言 的 许多 特性 ， 在 这 样 做 的 同时 ， 我 们 将 讨论 贯穿 在 今天 绝 大 多 
数 面 向 对 象 软件 里 的 概念 。 然 后 ， 在 6.5 节 中 ， 我 们 将 学 习 面 向 对 象 范 型 专 有 的 特性 。 


问题 与 练习 

工 在 什么 意义 上 ， 用 第 三 代 语言 编写 的 程序 是 机 器 无 关 的 ? 在 什么 意义 上 ， 它 们 还 是 依 下 于 机 器 的 ? 

2. 汇编 器 和 编译 器 的 区 别 是 什么 ? 

3. 我 们 可 以 用 下 面 的 话 概述 命令 型 程序 设计 范 型 ; 它 强调 的 是 描述 一 个 可 以 引出 手头 问题 解决 方案 的 过 
” 程 。 请 给 出 说 明 性 范 型 、 函 数 式 范 型 和 面向 对 象 范 型 的 类 似 概述 。 

4. 在 什么 意义 上 ， 第 三 代 程序 设计 语言 比 前 两 代 程序 设计 语言 更 高 级 ? 


EE 


6.2 ”传统 的 程序 设计 概念 


在 本 节 中 ， 我 们 将 研究 命令 型 程序 设计 语言 和 面向 对 象 程序 设计 语言 中 的 一 些 概念 。 我 们 
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将 会 从 Ada、C、C++、C#、FORTRAN 和 Java 等 程序 设计 语言 中 引出 一 些 例子 。 我 们 的 目标 并 
不 是 针对 某 一 种 语言 的 细节 纠缠 不 放 ， 而 只 是 要 展示 常见 语言 特性 是 如 何 出 现在 各 种 实际 程序 
设计 语言 中 的 。 因 此 ， 我 们 的 程序 设计 语言 集合 只 选择 具有 代表 性 的 例子 。C 是 第 三 代 命 令 型 
语言 。C++ 是 通过 对 C 语 言 进 行 扩展 得 到 的 面向 对 象 的 程序 设计 语言 。Java 和 C# 均 继承 了 C++ 的 
一 些 特 性 ， 它 们 都 是 面向 对 象 语 言 。(Java 是 Sun Microsystems 公 司 开发 的 ， 而 C# 是 微软 公司 的 
产品 ; Sun Microsystems 公 司 后 来 被 甲骨 文公 司 收购 了 。) FORTRAN 和 Ada 最 初 是 作为 第 三 代 命 
令 型 语言 设计 的 ， 尽 管 它 的 最 新 版 本 包含 了 大 多 数 的 面向 对 象 范 型 。 附 录 D 简 短 地 介绍 了 这 些 
语言 中 每 一 种 的 背景 。 

尽管 我 们 在 例子 中 涉及 了 C++、Java、C# 之 类 的 面向 对 象 语言 ， 但 是 本 节 中 将 把 程序 想象 
成 是 基于 命令 型 范 型 编写 的 程序 ， 这 是 因为 面向 对 象 程序 〈 如 描述 一 个 对 象 应 该 怎样 响应 外 部 
刺激 的 函数 ) 中 的 许多 单元 基本 上 都 是 简短 的 命令 型 语言 程序 。 后 面 在 6.5$ 节 ， 我 们 将 主要 讨论 
面向 对 象 范 型 独 有 的 特性 。 





命令 型 程序 设计 语言 的 一 个 子 集 是 称 为 脚本 语言 (scripting language ) 的 语言 集合 。 这 些 

语言 通常 用 来 执行 管理 任务 ， 而 不 是 开发 复杂 的 程序 。 这 种 任务 的 表述 称 为 脚本 (script )， 
它 解释 了 术语 “脚本 语言 "。 例 如， 计算 机 系统 的 管理 员 也 许 会 写 一 个 脚本 来 描述 一 系列 每 晚 
执行 的 需要 保持 记录 的 活动 ， 而 PC 的 用 户 也 许 会 写 一 个 脚本 来 指导 一 系列 程序 的 执行 ， 以 从 
数码 相机 中 读 取 照 片 ， 通 过 日 期 对 照片 建立 索引 ， 以 及 在 档案 存储 系统 中 存储 照片 的 副本 。 
脚本 语言 的 起 源 可 以 追溯 到 20 世 纪 60 年 代 的 作业 控制 语言 ， 当 时 在 批 处 理 作业 的 调度 中 它 被 
用 于 指导 操作 系统 ( 见 3.1 节 )。 甚 至 在 今天 ， 许 多 人 都 认为 脚本 语言 是 指导 其 他 语言 执行 的 
语言 ， 这 就 对 现在 的 脚本 语言 的 认识 产生 了 局 限 性 。 脚本 语言 的 例子 包括 Perl 和 PHP， 二 者 在 
控制 服务 器 端 Web 应 用 ( 见 4.3 节 ) 和 VBScript 中 很 受 欢迎 ，VBScript 是 Visual Basic 的 一 种 方 
言 ， 由 微软 公司 开发 并 用 于 Windows 的 特定 环境 下 。 | 


通常 ， 程 序 由 一 组 语句 组 成 ， 这 些 语句 一 般 可 以 分 成 3 类 : 声明 语句 、 命 令 语句 和 注释 。 声 明 
语 名 (declarative statement) 定义 了 程序 中 后 面 要 用 到 的 自 定 程序 


ee i , 让 一 一 - 
义 术语 ， 如 用 来 引用 数据 项 的 名 字 ; 命令 语句 〈imperative | | | 第 一 部 分 由 声明 语句 组 成， 
statement) 描述 了 潜在 的 算法 里 的 步骤 ;注释 (comment) | 描述 该 程序 要 操作 的 数据 
则 通过 比较 人 性 化 的 形式 来 解释 程序 中 的 一 些 难民 的 特性 ， | ne 

而 提高 程序 的 可 读 性 。 通常， 命令 型 程序 (或 者 面向 对 象 “ | 上 第 二 部 分 由 命令 语句 组 成， 
| | 王 描述 该 程序 要 实现 的 动作 





程序 中 的 命令 型 程序 ) 可 以 被 认为 具有 图 6-4 描 述 的 结构 。 “一 一 一 
它 以 描述 程序 要 操作 的 数据 的 一 组 声明 语句 开始 ， 紧 接 其 后 。 ”图 6-4 一 个 典型 的 命令 型 程序 
的 是 描述 要 执行 的 算法 的 命令 语句 。 现 在 ,很 多 语言 都 允许 或 程序 单元 的 结构 
声明 语句 和 命令 语句 自由 交织 存在 ， 但 其 概念 上 的 区 别 依 然 存 在 。 注 释 语句 是 很 分 散 的 ， 仅 仅 
出 现在 需要 对 程序 进行 解释 的 地 方 。 

根据 指引 ， 我 们 通过 考虑 语句 目录 来 研究 程序 设计 概念 ， 该 语句 目录 的 顺序 是 我 们 在 一 个 
旦 序 中 可 能 过 到 的 这 些 语句 的 顺序 ， 从 与 声明 语句 有 关 的 概念 开始 。 


6.2.1 变量 和 数据 类 型 
正如 在 1.8 节 中 提 到 的 那样 ， 高 级 程序 设计 语言 允许 使 用 描述 性 的 名 字 指 向 主 存储 器 中 的 
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位 置 ， 而 不 必 再 使 用 数字 地 址 ， 这 样 的 名 字 称 为 变量 (variable)。 之 所 以 这 样 取 名 是 因为 ， 随 
着 程序 的 执行 , 只 要 改变 存储 在 这 个 位 置 里 的 值 , 那么 与 该 名 字 相 联系 的 值 就 会 改变 。 与 Python 
不 同 ， 本 章 中 我 们 的 示例 语言 要 求 程序 在 使 用 变量 之 前 先 用 声明 语句 标识 变量 。 同 时 ， 这 些 声 
明 语句 也 会 要 求 程序 员 描 述 变 量 所 指向 的 将 存储 在 存储 器 位 置 中 的 数据 的 类 型 。 

这 样 的 类 型 称 为 数据 类 型 (data type)， 它 决定 了 数据 项 的 编码 方式 以 及 在 该 数据 上 可 执行 
的 操作 。 例 如 ， 整 型 (integer) 就 是 可 能 以 二 进 制 补 码 记 数 法 存储 的 数字 数据 ， 它 是 由 全 体 整 
数组 成 的 。 可 以 在 整 型 数据 上 进行 的 运算 包括 传统 的 算术 运算 和 相对 大 小 的 比较 ， 如 判断 一 个 
值 是 否 比 男 一 个 值 大 。 实 型 (real) 有 时 也 称 为 浮 点 型 (float)， 是 指 可 能 以 浮 点 记 数 法 存储 的 
整数 之 外 的 数字 数据 。 可 以 在 实 型 数 上 进行 的 操作 类 似 于 那些 可 以 在 整 型 数 上 进行 的 操作 ， 但 
是 注意 ， 把 两 个 实 型 数 相 加 与 把 两 个 整 型 数 相 加 是 两 个 不 一 样 的 操作 。 

假设 我 们 需要 在 一 个 程序 中 使 用 变量 weightLimit 来 指向 一 个 主 存储 器 区 域 ， 这 区 域 里 包 
含 着 一 个 用 二 进 制 补 码 记 数 法 编码 的 数值 。 在 程序 设计 语言 C、C++、Java 和 C# 中 ， 我 们 可 以 在 
程序 的 开头 插入 声明 语句 : 

int WeightLimit; 
这 个 语句 的 意思 是 :“ 名 字 WeightLimit 将 要 在 后 面 的 程序 中 用 到 ， 它 指向 一 个 存储 器 区 域 ， 
这 个 存储 器 区 域 中 包含 着 一 个 用 二 进 制 补 码 记 数 法 存储 的 值 。 ”同一 类 型 的 多 个 变量 通常 可 以 在 
同一 个 声明 语句 中 声明 。 例 如 ， 语 名 

int Height, Width; 


声明 了 两 个 整 型 变量 Height 和 width。 此 外 ， 大 多 数 语 言 允 许 在 声明 变量 时 ， 为 变量 赋 一 个 初 
始 值 。 因 此 ， 语 句 

int WeightLimit = 100; 
不 仅 声明 了 一 个 整 型 变量 weightLimit， 而 且 还 为 这 个 变量 赋 了 一 个 初始 值 100。 与 此 相反 ， 
像 Python 这 样 的 动态 类 型 语言 允许 变量 在 不 声明 类 型 的 情况 下 被 赋值 ， 对 这 种 变量 的 正确 类 型 
检查 会 在 后 面 对 它 们 执行 运算 时 进行 。 

其 他 通用 数据 类 型 还 包括 字符 型 和 布尔 型 。 字 符 型 指 的 是 由 符号 组 成 的 数据 ， 它 们 通常 使 
用 ASCII 或 者 Unicode 进 行 编码 存储 。 可 以 在 这 种 数据 上 进行 的 运算 包括 比较 运算 ， 如 按照 字母 
顺序 判断 一 个 符号 是 否 在 另 一 个 符号 的 前 面 ， 测 试 查看 一 个 符号 串 是 否 在 另 一 个 符号 串 中 ， 以 
及 将 一 个 符号 串 连接 在 另 一 个 符号 串 的 尾部 从 而 形成 一 个 更 长 的 符号 串 。 语 名 


char Letter, Digit; 


在 程序 设计 语言 C、C++、C# 和 Java 中 用 来 声明 两 个 字符 型 变量 : Letter 和 Digit。 
布尔 型 (Boolean) 是 指数 据 项 的 取 值 仅 可 为 真 或 为 假 。 可 以 在 布尔 型 数据 上 进行 的 运算 包 
括 判 断 当前 值 是 真 还 是 假 。 例 如， 如 果 变 量 LimitExceeded 被 声明 为 布尔 型 ， 那么 下 面 这 种 形 
式 的 语句 就 是 合理 的 : 
if (LimitExceeded) then (...) else (...) 


作为 原 语 包括 在 程序 设计 语言 里 的 数据 类 型 〈 像 对 于 整 型 的 int， 对 于 字符 的 char) 称 为 
基本 数据 类 型 (primitive data type)。 我 们 所 知道 的 整 型 、 浮 点 型 、 字 符 型 、 布 尔 型 都 是 通用 的 
原 语 ， 其 他 数据 类 型 (包括 图 像 、 音 频 、 视 频 以 及 超 文本 〉 目前 还 没有 成 为 程序 设计 语言 的 通 
用 原 语 。 但 是 ， 像 GIF、JPEG 和 HTML 这 样 的 类 型 可 能 马上 就 要 像 整 型 和 浮 点 型 一 样 通用 了 。 
在 6.5 节 和 8.4 节 , 我 们 将 学 习 到 面向 对 象 范 型 是 如 何 使 程序 员 在 一 门 程序 设计 语言 提供 的 原 语 类 
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型 的 基础 之 上 扩展 可 用 数据 类 型 的 指令 系统 的 。 的 确 ， 这 种 能 力 是 面向 对 象 范 型 的 一 个 著名 的 
下 面 程 序 段 是 用 C 语 言及 其 派生 语言 CH+、C# 和 和 Java 表达 的 , 它 将 变量 Length 和 Width 声 明 
为 浮 点 型 ， 变 量 Price、Tax 和 Total 声 明 为 整 型 ， 变 量 Symbol 声 明 为 字符 型 。 
float Length, Width; 


int Price, Tax, Total; 
char Symbol; 


在 6.4 节 ， 我 们 会 看 到 翻译 器 是 如 何 利 用 从 这 些 声明 语句 中 收集 到 的 知识 ， 把 一 个 程序 从 高 
级 语言 形式 翻译 为 机 器 语言 形式 的 。 这 里 ， 我 们 要 注意 的 是 ， 这 些 信息 可 以 用 来 识别 错误 。 例 
如 ， 对 于 两 个 早先 声明 为 布尔 型 的 变量 ， 如 果 翻 译 器 发 现 一 个 要 求 对 它们 做 加 法 的 语句 ， 那 它 
很 可 能 认为 这 个 语句 是 错误 的 ， 并 把 这 个 发 现 报告 给 用 户 。 


6.2.2 ”数据 结构 


除了 数据 类 型 ， 程 序 中 的 变量 通常 与 数据 结构 (data structure) 有 关 ， 即 与 数据 在 概念 上 的 
形态 或 布局 有 关 。 例 如 ， 文 本 通常 被 看 作 是 一 个 长 的 字符 串 ， 而 销售 记录 可 能 被 视 为 数值 的 矩 
形 表 ， 其 每 一 行 代表 某 位 雇员 完成 的 销售 ， 每 一 列 代表 某 一 天 所 完成 的 销售 。 

一 个 常用 的 数据 结构 是 数组 (array)， 即 由 相同 类 型 的 元 素 组 成 的 块 ， 如 一 维 列表 、 一 个 由 
行 和 列 组 成 的 二 维 表 或 更 高 维 数 的 表 。 为 了 在 程序 中 建立 这 样 的 数组 ， 大 多 数 程序 设计 语言 要 
求 声明 语句 在 声明 数组 名 字 的 同时 也 要 明确 指出 数组 每 一 维 的 长 度 。 例 如 ， 图 6-5 显 示 了 由 C 语 


言语 名 
int Scores[2] [9]; 


声明 的 概念 上 的 结构 ， 它 的 意思 是 :“ 变 量 Scores 将 要 在 后 面 的 程序 单元 中 使 用 到 ， 指 向 一 个 2 
行 9 列 的 二 维 整 型 数组 .” 在 FORTRAN 中 同样 的 声明 语句 要 写成 
INTEGER Scores (2,9) 

数组 一 旦 声明 ， 就 能 够 通过 它 的 名 字 在 程序 中 的 任何 地 方 引用 它 ， 或 者 通过 一 个 称 作 索 引 
Cindex) 的 整数 值 来 标识 这 些 数组 的 组 成 元 素 ， 指 定 所 需 的 行 、 列 等 信息 。 但 是 ， 索 引 的 范围 
在 不 同 的 语言 中 是 不 同 的 。 例 如 ， 在 C 语 言 ( 及 其 派生 语言 Ct+、Java 和 C#) 中 ， 索 引 是 从 0 开 
始 ， 也 就 是 说 对 称 为 Scores 的 数组 〈 上 文 已 声明 ) 的 第 2 行 第 4 列 的 条 目 将 用 Scores[1] [3] 来 
引用 ， 而 第 1 行 第 1 列 的 条 目 将 用 Scores [0] [0] 来 引用 。 相 反 ， 在 FORTRAN 程 序 中 索引 是 从 1 
开始 的 ， 所 以 第 2 行 第 4 列 的 条 目 将 用 Scores [2] [4] 来 引用 (可 再 参考 图 6-5)。 


Scores 

在 FORTRAN 中 写作 在 C 及 其 派生 语言 
Scores(2，4)， 写作 Scores[1] [3]， 
索引 从 I 开 始 索引 从 0 开始 


图 6-5 拥有 2 行 9 列 的 二 维 数组 


相 比 由 同一 种 数据 类 型 的 数据 元 素 组 成 的 数组 ， 聚 合 类 型 [aggregate type， 也 称 结构 
Cstructure)、 记 录 (record)， 有 时 还 称 异 构 数 组 (heterogeneous array)] 是 一 个 数据 块 ， 不 同 的 
元 素 在 这 个 数据 块 中 可 以 有 不 同 的 类 型 。 例 如 ， 一 个 雇员 的 数据 块 可 能 由 一 个 称 为 Name 的 字符 
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型 条 目 、 一 个 称 为 age 的 整 型 条 目 以 及 一 个 称 为 Skill1Rating 的 实 型 条 目 组 成 。 这 样 的 聚合 类 
型 用 C 语 言 声 明 如 下 : 
struct { char Name[25]; 
int Age; 
float SkillRating; 
} Employee; 

上 述 声 明 的 意思 是 : 变量 Employee 指 向 一 个 结构 (structer， 简 写 为 struct )， 这 个 结构 有 3 
个 构成 元 素 ， 它 们 分 别 是 Name (包含 25 个 字符 的 字符 串 )、age 和 SkillRating ( 见 图 6-6)。 
一 旦 声明 了 一 个 这 样 的 聚合 体 ， 程 序 员 就 可 以 


使 用 这 个 结构 的 名 字 (Employee) 来 指向 整个 Mopect ey 

集合 体 ， 或 者 用 结构 的 名 字 跟 一 个 句点 和 字段 ~ pmployee.Nane 

名 (如 Employee.Age》 来 表示 集合 体 中 的 单 gnployee-| EN 

个 字段 (field)。 Employee.Age 
在 第 8 章 , 我 们 将 会 看 到 诸如 数组 这 样 的 概 

念 结构 是 如 何在 计算 机 内 部 真正 实现 的 。 特 别 ed 

是 ， 我 们 将 会 学 到 ， 一 个 数组 里 面 的 数据 可 以 

散布 在 主 存储 器 或 者 海量 存储 器 上 的 广大 区 域 图 56 结构 Bapioyes 的 柑 仿 布 局 


内 ， 这 就 是 将 数据 结构 表达 成 概念 上 的 数据 形态 或 者 数据 布局 的 原因 。 当 然 ， 计 算 机 存储 系统 
中 的 实际 布局 也 许 与 它 在 概念 上 的 布局 完全 不 同 。 


6.2.3 ”常量 和 字面 量 


有 时 ， 在 程序 中 要 用 到 预先 确定 的 固定 值 。 例如， 一 个 管理 机 场 附 近 区 域 空中 交通 的 程序 ， 
也 许 要 无 数 次 引用 一 些 关 于 机 场 的 海拔 高 度 的 数据 。 当 编写 这 样 一 个 程序 的 时 候 ， 在 每 次 需要 
这 个 数据 时 ， 我 们 都 可 以 从 字面 上 包含 这 个 值 ， 比 如 说 645 英 尺 〈 约 196.6 米 )。 一 个 值 的 这 样 一 
种 显 式 出 现 称 为 字面 量 (literal)。 字 面 量 的 使 用 导致 了 诸如 

EffectiveAlt = Altimeter + 645 
这 样 的 程序 语句 的 出 现 ， 其 中 EffectiveAlt 和 Altimeter 是 假定 的 变量 ， 而 645 是 一 个 字面 量 。 
因此 ， 这 条 语句 的 意思 是 将 赋 给 变量 Al1timeter 的 值 加 上 645 的 结果 赋 给 变量 EffectiveAlt。 

在 大 多 数 程序 设计 语言 中 ， 由 文本 组 成 的 字面 量 都 是 用 单 引号 或 者 双 引号 来 划 界 的 ， 以 便 
与 其 他 程序 部 分 相 区 分 。 例 如 ， 语 名 


LastName = 'Smith' 
可 以 用 来 把 文字 “Smith” 赋 值 给 变量 LastName， 而 语句 

LastName = Smith 
则 是 把 变量 smith 的 值 赋 给 变量 LastName。 

通常 ， 使 用 字面 量 不 是 一 个 好 的 编程 习惯 ， 因 为 字面 量 会 掩盖 包含 字面 量 的 语句 的 真实 意 
义 。 例 如 ， 当 一 个 读者 读 到 语句 

EffectiveRAlt = Altimeter + 645 
时 ， 他 如 何 知 道 这 个 645 代 表 的 是 什么 呢 ? 此 外 ， 字 面 量 的 使 用 会 使 在 必要 时 修改 程序 的 工 
作 变 得 复杂 。 如 果 将 空中 管制 程序 移植 到 另 一 个 机 场 , 那么 所 有 对 机 场 海拔 高 度 的 引用 都 将 
要 修改 。 如 果 每 一 处 对 海拔 高 度 的 引用 都 使 用 了 字面 量 645， 那 么 要 在 整个 程序 中 定位 每 一 
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个 这 样 的 引用 并 且 加 以 修改 。 再 假设 在 数量 上 ， 而 不 仅仅 是 在 海拔 高 度 上 ， 同 时 也 使 用 了 这 
个 字面 量 645， 这 个 问题 将 会 变 得 更 加 复杂 。 我 们 如 何 能 够 知道 哪个 645 需 要 保留 ， 哪 个 需 
要 修改 呢 ? 

为 了 解决 这 些 问 题 ， 程 序 设计 语言 允许 为 特定 的 不 会 改变 的 值 分 配 一 个 描述 性 的 名 字 。 这 
种 名 字 称 为 常量 (constant)。 例 如 ， 在 Ct++ 和 C# 语 言 中 ， 声 明 语句 


const int AirportAlt = 645; 


将 标识 符 AirportAlt 与 一 个 固定 的 值 645 我 们 认为 它 是 整 型 值 》 联 系 起 来 。 在 Java 语 言 中 ， 
类 似 的 概念 表达 为 


final int AirportAlt = 645; 


根据 这 些 声 明 ， 描述 性 的 名 字 AirportAlt 能 够 用 于 字面 量 645 出 现 的 场合 。 若 将 这 种 常量 用 于 
伪 代 码 中 ， 语 句 

EffectiveRlt = Altimeter + 645 
可 以 改写 成 

EffectiveAlt = Altimeter + AirportAlt 


这 种 方式 能 够 较 好 地 表达 语句 的 含义 。 此 外 ， 如 果 用 这 样 的 常量 来 替代 字面 量 ， 当 程序 要 移植 
到 另 一 个 海拔 高 度 为 267 英 尺 〈 约 81.4 米 ) 的 机 场 时 ， 仅 仅 修 改 这 个 定义 常量 的 声明 语句 就 可 以 
将 对 机 场 海拔 高 度 的 所 有 引用 改 为 新 的 值 。 


6.2.4 ”赋值 语句 


一 旦 声明 了 用 于 程序 的 专门 术语 (如 变量 和 常数 ), 程序 员 就 可 以 开始 描述 涉及 的 算法 了 ， 
这 要 依靠 命令 语句 来 实现 。 最 基本 的 命令 语句 就 是 赋值 语句 (assignment statement)， 它 将 一 
个 值 赋 给 一 个 变量 (或 者 更 确切 地 说 ， 存 储 在 该 变量 所 标识 的 存储 区 域 中 )。 这 种 语句 的 语法 
结构 通常 由 一 个 变量 、 一 个 代表 赋值 运算 的 符号 以 及 一 个 赋值 表达 式 组 成 。 这 种 语句 的 语义 
就 是 对 表达 式 进 行 求 值 ， 把 得 到 的 结果 存储 为 变量 的 值 。 例 如， 在 C、C++、C# 和 Java 语 言 中 ， 
语句 

Ze= 人 + 
是 将 Xx 和 Y 相 加 的 和 赋 给 变量 2。 行 尾 的 分 号 在 许多 命令 式 语言 中 用 来 分 隔 语 句 ， 是 这 些 语言 的 
赋值 语句 与 Python 赋值 语句 在 语法 上 的 唯一 区 别 。 在 一 些 其 他 语言 (如 Ada 语 言 ) 中， 等 价 的 语 
句 可 以 写成 

名 


注意 ， 这 些 语句 仅仅 在 赋值 运算 符 语法 表示 上 不 同 ， 在 C、C++、C# 和 Java 语 言 中 ， 仅 仅 使 用 一 
个 等 号 来 表示 ， 而 在 Ada 语 言 中 ， 要 用 一 个 冒号 加 等 号 的 形式 来 表示 。APL 语 言 中 的 赋值 运算 符 
可 能 更 好 一 些 ，APL 语 言 是 由 肯 尼 思 。 艾 弗 森 (Kenneth E. Iverson) 在 1962 年 设计 的 。(APL 是 
A Programming Language 的 缩写 。) 它 使 用 一 个 箭头 来 表示 赋值 。 因 此 ， 前 面 的 赋值 在 APL 语 言 
中 可 以 表示 为 

Zo-X+Y 
不 幸 的 是 ， 一 直 以 来 大 多 数 键盘 上 都 没有 “一 ”符号 。 

赋值 语句 的 许多 功能 都 与 语句 右边 的 表达 式 的 作用 域 关系 密切 。 一 般 而 言 ， 任 何 一 个 代数 表 
达 式 都 可 以 用 在 赋值 表达 式 中 ， 包 括 通常 用 符号 +、-、* 和 /分 别 代表 算术 运算 中 的 加 法 、 减 法 、 
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乘法 和 除法 。 一 些 语 言 (包括 Ada 和 Python， 但 不 包括 C 或 Java) 用 ** 组 合 来 表示 求 寡 ， 因 此 表 
达 式 

拔 坟 业 疫 
表示 x?>。 但 是 ， 各 种 语言 对 这 种 表达 式 的 解释 是 不 一 样 的 。 例 如 ， 对 于 表达 式 2*4+6/2， 如 果 是 从 
右 问 左 求 值 ， 得 到 的 值 就 是 14， 而 如 果 从 左 向 右 求 值 ， 得 到 的 值 就 是 7。 这 种 不 确定 性 通常 是 
过 运算 符 优先 级 〈operator precedence) 规则 来 解决 的 ， 这 意味 着 某 些 运算 的 优先 级 比 其 他 运算 的 
高 。 传 统 的 代数 规则 指出 乘法 和 除法 的 优先 级 比 加 法 和 减法 的 高 ， 也 就 是 说 ， 乘 法 和 除法 要 在 加 
法 和 减法 之 前 执行 。 根 据 这 个 约定 ， 前 面 的 表达 式 的 结果 应 该 是 11。 在 大 多 数 语言 中 ， 括 号 的 优 
先 级 比 所 有 运算 符 的 优先 级 都 高 。 因 此 ，2*(4+6)/2 的 结果 应 该 是 10。 

许多 程序 设计 语言 允许 使 用 一 个 符号 表示 多 种 运算 。 在 这 些 情况 下 ， 符 号 的 意义 只 能 根据 
操作 数 的 数据 类 型 来 确定 。 例 如， 当 操 作 数 是 数值 时 , 符号 + 传统 上 表示 加 法 。 但 在 某 些 语言 里 ， 
如 Java 和 Python， 当 操作 数 是 字符 串 时 ， 该 符号 表示 连接 。 也 就 是 说 ， 表 达 式 

"abra'” + 'cadabra' 
的 结果 是 abracadabra。 一 个 运算 符 的 这 种 多 种 用 法 称 为 重 载 (overloading)。 许 多 程序 设计 语言 
都 提供 了 常见 运算 符 的 内 置 重 载 ， 而 男 外 一 些 程序 设计 语言 (如 Ada、C++ 和 C#) 可 能 允许 程 
序 员 定义 额外 的 重 载 的 意义 ， 甚 至 添加 额外 的 运算 符 。 


6.2.5 控制 语句 


控制 语句 〈control statement) 是 可 以 改变 程序 中 语句 执行 次 序 的 命令 语句 。 在 所 有 的 程序 

设计 结构 中 ， 某 些 控制 语句 受到 了 极 大 的 关注 并 且 引 发 了 很 大 的 争议 。 主 要 起 因 是 最 简单 的 控 
制 语 名 一 一 goto 语 句 。 它 提供 了 一 种 把 执行 顺序 转向 另 一 个 位 置 的 手段 ， 这 个 位 置 是 用 名 字 或 
数 标记 的 ， 这 仅仅 是 机 器 语言 级 的 JUOMP 指 令 的 直接 应 用 。 但 在 高 级 语言 中 ， 这 个 特点 意味 着 程 
序 员 将 写 出 像 
goto 40 
Evade () 
goto 70 
40 if (KryptoniteLevel < LethalDose) then goto 60 

goto 20 
60 RescueDamsel () 
TY 


这 样 可 读 性 很 差 的 程序 ， 而 仅仅 使 用 一 个 语句 ， 如 


if (KryptoniteLevel < LethalDose) : 





DN 
[= 


RescueDamsel () 
else: 
Evade () 


就 可 以 完成 相同 的 工作 。 

为 了 避免 产生 这 样 的 复杂 性 ， 现 代 的 程序 设计 语言 设计 出 来 的 控制 语句 ， 能 允许 在 一 个 词 
法 结构 中 表达 整个 分 支 模式 。 选 择 什么 样 的 控制 语句 放 到 一 个 语言 中 是 一 种 设计 决策 。 目 标 就 
是 要 提供 一 种 语言 ， 使 得 不 仅 可 以 以 可 读 的 形式 表达 算法 ， 而 且 可 以 帮助 程序 员 获 得 这 种 可 读 
性 。 为 了 实现 这 个 目标 ， 可 以 限制 使 用 那些 会 导致 不 良 程序 设计 的 特性 ， 同 时 鼓励 使 用 能 够 优 
化 设计 的 特性 。 结 果 是 产生 了 称 为 结构 化 程序 设计 (structured programming) 的 实践 ， 它 包含 
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了 有 组 织 的 设计 方法 ， 以 及 对 控制 语句 的 合理 使 用 。 这 个 方法 的 中 心思 想 就 是 要 设计 容易 理解 
的 并 且 满足 需求 规格 说 明 的 程序 。 





和 自然 语言 一 样 ， 不 同 程序 设计 语言 本 全 月 者 往 在 公开 人 于 不 疝 站 到 让 并 且 经 常 站 
在 各 自 的 观点 上 争论 语言 之 间 的 优 劣 ， 有 时 候 这 些 区 别 是 显著 的 ， 如 涉及 不 同 的 程序 设 
计 范 型 时 ， 而 其 他 情况 中 ， 这 种 差异 却 很 微妙 。 例 如 ， 尽 管 Pascal 语 言 对 过 程 和 函数 进行 
了 区 分 ( 见 6.3 节 )， 但 是 C 和 Python 程序 员 把 这 两 者 都 称 作 函 数 。 这 是 因为 Python 程序 声 
明 过 程 的 方式 与 声明 函数 的 方式 是 一 样 的 ， 只 是 没有 定义 返回 值 。 一 个 类 似 的 例子 就 是 ， 
C++ 程序 员 把 包含 在 对 象 内 的 过 程 称 为 成 员 函 数 ， 而 通用 术语 称 之 为 方法 。 造 成 这 种 差异 
的 原因 在 于 ，C++ 是 在 C 语 言 的 基础 上 扩展 而 来 的 。 另 外 一 个 文化 差异 是 Ada 程 序 中 的 保 
留 字 通 常用 大 写字 母 或 粗 体 排版 ， 而 这 种 习惯 对 于 C、C++、FORTRAN 和 Java 的 使 用 者 来 
说 却 不 常见 。 

尽管 本 书 大 部 分 章节 都 是 用 Python 做 的 范例 ， 但 是 每 一 个 具体 的 例 于 痢 来 用 i Pe 涉及 
的 程序 设计 语言 相 适 应 的 风格 。 当 你 碰见 这 些 例子 的 时 候 ， 一 定 要 记 住 的 是 ， 这 些 例子 代表 
的 实际 上 是 程序 设计 语言 中 的 通用 思想 ,而 不 是 作为 传授 某 种 程序 设计 语言 细节 的 一 种 手段 。 
不 要 只 见 树 木 不 见 森 林 。 


在 第 5 章 中 ， 我 们 已 经 过 到 两 种 常见 的 分 支 结构 ， 即 用 if-else 和 while 语 句 表示 的 分 支 
结构 。 这 几乎 出 现在 所 有 的 命令 式 语言 、 函 数 式 语言 或 面向 对 象 语言 中 ， 更 准确 地 说 ，Python 
语句 

if (condition): 

statementA 
else: 


statementB 


while (condition): 
body 


在 C、C++、C# 和 Java 中 将 被 写成 : 

if (condition) statementA; else statementB; 
和 

while (condition) { body } 


注意 这 样 的 事实 ， 这 些 语句 在 4 种 语言 中 是 相同 的 ， 这 是 因为 Ct+、C# 和 Java 都 是 命令 式 语言 
的 面向 对 象 的 扩展 。 与 之 相反 ， 在 语言 Ada 中 相应 的 语句 将 被 写成 


IF condition THEN 
statementA; 
ELSE 
statementB; 
END IF; 


和 
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WHILE condition LOOP 
body 
END LOOP; 
另 一 个 常见 的 分 支 结构 常用 switch 或 case 语 句 表示 。 它 提供 了 依据 赋 给 指定 变量 的 值 ， 
在 多 个 选项 中 选择 一 个 语句 序列 的 方法 。 例 如 ， 在 C、C++、C# 和 Java 语 言 中 ， 语 句 
switch (variable) { 
case 'A': statementA; break; 
case ‘'B': statementB; break; 
case 'C': statementC; break; 
default: statementD;} 
是 执行 statementA、statementB 还 是 statementc， 取决 于 variable 的 当前 值 是 A、B 还 是 C; 
如 果 variable 的 值 是 其 他 的 值 ， 那 将 执行 statementD。 在 Ada 语 言 中 ， 相 同 的 结构 将 被 写成 : 
CASE variable IS 
WHEN 'A'=> statementA; 
WHEN 'B'=> statementB; 
WHEN 'C'=> statementC; 
WHEN OTHERS=> statementD; 
END CASE; 
另外 还 有 一 个 称 为 for 循 环 的 常见 控制 结构 如 图 6-7 所 示 , 这 是 CH+、C# 和 Java 语 言 中 的 表示 。 
这 个 结构 不 同 于 第 5 章 中 介绍 的 Python 的 for 结 构 。 对 于 迭代 遍历 数据 列表 的 循环 ，C 语 言 家 族 的 
fo 结构 的 初始 化 、 修 改 和 终止 部 分 都 不 是 隐 式 建立 的 ， 而 是 显 式 地 包含 在 一 条 语句 里 。 当 循环 
体 对 于 指定 范围 内 的 每 个 值 都 要 执行 一 次 时 ， 这 样 的 语句 就 很 方便 。 特 别 地 ， 图 6-7 中 的 语句 指示 
循环 体 被 重复 执行 一 一 第 一 次 count 的 值 为 1， 第 二 次 Ccount 的 值 为 2， 第 三 次 count 的 值 为 3。 包 
含 这 两 种 foz 结 构 的 两 类 程序 设计 语言 在 语法 上 可 能 会 有 所 区 别 ， 如 foreach 或 for...in。 


| 


给 count 赋值 1 


| 


Count<4? 


起 
把 count+1 的 
循环 体 | 值 赋 给 count 


假 


for (int Count = 1; Count < 4; Count++) 
body }; 


图 6-7 ”C++、C# 和 Java 语 言 中 的 for 循 环 结构 及 其 表示 


根据 所 引用 的 例子 ， 我 们 可 以 得 到 这 样 一 个 结论 ， 即 通用 的 分 支 结构 存在 于 所 有 命令 式 程 
序 设 计 语言 和 面向 对 象 程序 设计 语言 中 ， 而 且 仅 有 细微 的 变化 。 从 计算 机 科学 的 理论 中 我 们 可 
以 了 解 到 一 个 有 些 令 人 吃惊 的 结论 ， 这 就 是 仅仅 需要 这 些 结构 中 的 一 小 部 分 就 足以 保证 程序 设 
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计 语 言 解决 所 有 可 以 由 算法 解决 的 问题 。 我 们 将 会 在 第 12 章 研究 这 个 问题 。 现 在 ， 我 们 只 是 指 
出 ， 学 习 程 序 设计 语言 不 是 一 个 无 休止 的 学 习 各 种 控制 语句 的 过 程 ， 在 当今 程序 设计 语言 中 可 
以 找到 的 大 多 数控 制 结构 本 质 上 都 是 本 书 介 绍 的 这 些 结构 的 变 体 。 


6.2.6 注释 


不 管 一 种 程序 设计 语言 设计 得 多 么 好 ， 也 不 管 一 个 程序 把 该 语言 的 特性 应 用 得 多 么 出 色 ， 
当 人 们 试图 阅读 和 理解 这 个 程序 时 ， 程 序 的 附加 信息 通常 都 是 有 用 的 ， 或 者 是 必须 要 有 的 。 因 
此 ， 程 序 设计 语言 提供 了 在 程序 中 插入 解释 性 语句 的 方法 ， 这 些 语句 称 为 注释 《comment)。 翻 
译 器 会 忽略 这 些 注释 语句 ， 因 此 对 于 机 器 来 讲 ， 注 释 的 存在 与 否 都 不 影响 程序 的 执行 。 无 论 源 
程序 有 没有 注释 ， 翻 译 器 生成 的 程序 的 机 器 语言 版 本 都 是 一 样 的， 但 对 人 来 讲 ， 这 些 语句 提供 
的 信息 是 程序 的 一 个 重要 组 成 部 分 。 若 没有 这 些 注释 ， 大 型 的 复杂 程序 就 很 容易 阻碍 程序 员 的 
理解 。 

在 程序 中 插入 注释 的 方法 通常 有 两 种 。 一 种 是 用 两 个 特殊 标记 将 整个 注释 括 起 来 ， 一 个 标 
记 放 在 注释 的 开头 ， 一 个 标记 放 在 注释 的 末尾 。 另 一 种 是 标示 出 注释 的 开头 ， 这 一 行 标记 右边 
的 部 分 都 属于 注释 。 在 C++、C# 和 Java 中 ， 我 们 可 以 同时 看 到 这 两 种 注释 方法 的 应 用 。 它 们 用 
/* 和 */ 来 包围 注释 ， 用 // 开 始 一 个 注释 直至 行 末 。 因 此 ， 

/* This is a comment. */ 
和 

// This is a comment. 
都 是 合法 的 注释 语句 。 

通常 ， 注 释 要 求 用 词 少 ， 而 且 含义 明确 。 当 为 了 制作 内 部 文档 而 要 求 一 些 初 级 程序 员 使 用 
注释 语句 的 时 候 ， 他 们 容易 为 

ApproachAngle = SlipAngle + HyperSpaceIncline; 
这 样 的 语句 写 出 类 似 “ 通 过 把 HypersSpaceIncline 和 SlipAngle 相 加 计算 ApproachAngle。” 
这 样 的 注释 。 这 种 注释 是 多 余 的 ， 除 了 增加 程序 的 长 度 ， 对 解释 程序 没 一 点 帮助 。 记 住 ， 注 释 
的 目的 就 是 解释 程序 ， 而 不 是 重复 。 对 于 这 条 语句 的 一 个 更 合适 的 注释 应 该 是 解释 为 什么 要 计 
算 ApproachAngle (如 果 这 一 点 不 很 明显 的 话 )。 例如， 注释 “ApproachAngle 将 会 在 后 面 计 
算 ForceFieldJettisonVelocity 时 使 用 ， 并 且 在 此 后 就 不 再 使 用 了 ”就 比 前 面 的 注释 更 有 
用 一 些 。 

此 外 ,分 散在 程序 语句 之 中 的 注释 有 时 会 影响 人 们 跟踪 程序 流程 的 能 力 , 使 理解 程序 变 
得 比 没有 注释 的 时 候 还 要 困难 .一 个 好 方法 就 是 将 关于 某 个 单一 程序 单元 的 注释 统一 放 在 一 
个 位 置 上 ， 比 如 放 在 该 程序 单元 的 开始 位 置 。 这 就 给 读者 提供 了 程序 单元 注释 的 确切 地 点 ， 
同时 也 提供 了 可 以 用 来 描述 此 程序 单元 的 目的 和 综合 特征 的 地 点 。 如 果 这 个 格式 在 所 有 的 程 
序 单元 中 都 采用 了 , 写 出 来 的 程序 就 能 在 某 种 程度 上 达到 一 致 性 一 一 每 个 程序 单元 都 包括 一 
组 解释 性 的 语句 ,以 及 随后 对 该 程序 单元 的 正式 表示 。 程序 中 的 这 种 一 致 性 提高 了 程序 的 可 
读 性 。 


1. 为 什么 使 用 常量 的 程序 设计 风格 比 使 用 字面 量 的 要 好 ? 
2. 声明 语句 和 命令 语句 的 区 别 是 什么 ? 


202 第 6 章 程序 设计 语言 


3. 列举 一 些 党 见 的 数据 类 型。 
4. 给 出 命令 式 程序 设计 语言 和 面向 对 象 程序 设计 语言 里 的 一 些 常见 控制 结构 。 
5. 数组 和 聚合 类 型 之 间 的 区 别 是 什么 ? 


一 一 一- — 一 一 - = 一 < 一 一 一 一 一 


6.3 ”过 程 单元 


在 前 面 的 章节 中 ， 我 们 已 经 看 到 了 将 大 程序 拆 分 成 小 的 可 管理 的 单元 的 一 些 好 处 。 在 本 节 
中 ， 我 们 将 主要 讨论 函数 的 概念 ， 函 数 是 一 个 命令 型 语言 获得 程序 的 模块 化 描述 的 主要 技术 。 
正如 第 5 章 中 提 到 的 , 多 年 来 程序 设计 语言 用 了 许多 术语 来 表述 这 个 重要 概念 : 子 程序 、 子 例 程 、 
过 程 、 方 法 、 函 数 ， 有 时 含义 略 有 不 同 。 在 严格 的 命令 式 语言 中 ， 基 本 是 用 函数 这 个 术语 来 表 
述 这 个 概念 ， 但 在 面向 对 象 语 言 中 ， 程 序 员 们 在 指定 对 象 应 该 如 何 啊 应 外 部 刺激 时 ， 经 常 更 喜 
欢 使 用 方法 Cmethod) 这 个 术语 。 


6.3.1 函数 


从 一 般 的 意义 上 来 说 ， 函 数 〈function) 就 是 实现 一 个 任务 的 一 组 指令 的 集合 ， 它 能 够 用 作 
其 他 程序 单元 的 抽象 工具 。 当 请 求 了 函数 提供 的 服务 时 ， 程 序 的 控制 权 就 转移 给 了 函数 ， 在 函 
数 执行 完 之 后 ， 程 序 控制 权 又 返回 到 最 初 的 程序 单元 〈 见 图 6-8)。 将 控制 权 转 移 给 函数 的 过 程 
一 般 称 为 调用 〈call 或 者 invoke) 函数 。 我 们 将 一 个 请 求 函 数 执行 的 程序 单元 称 为 调用 单元 。 





调用 程序 单元 


函数 被 执行 





当 函 数 完成 时 ， 控 制 
权 返 回 到 调用 环境 


图 6-8 一 个 函数 的 控制 流 


在 第 5 章 的 Python 示 例 中 ,函数 通常 被 写作 单个 的 程序 单元 , 单元 以 一 个 称 为 函数 头 (header) 
的 语句 开始 ， 其 中 标识 了 函数 的 名 称 。 函 数 头 后 面 是 定义 函数 细节 的 语句 。 这 些 语句 往往 以 与 
传统 的 命令 程序 相同 的 方式 排列 ， 以 声明 语句 开始 〈 描 述 函 数 中 使 用 的 变量 )， 接 着 是 命令 语句 
《描述 函数 执行 时 要 履行 的 步骤 )。 

一 般 来 说 ， 在 函数 中 声明 的 变量 称 为 局 部 变量 (local variable)， 意 思 是 它 只 能 在 这 个 函数 
的 内 部 使 用 。 局 部 变量 能 够 消除 由 于 两 个 独立 的 函数 碰巧 使 用 同一 名 称 的 变量 所 产生 的 混 消 。 
[一 个 程序 中 可 以 引用 某 个 变量 的 部 分 称 为 该 变量 的 作用 域 (scope)。 因 此 ， 局 部 变量 的 作用 域 
就 是 声明 它 的 函数 。 没 有 限制 在 程序 中 某 个 特定 部 分 使 用 的 变量 称 为 全 局 变量 (global variable )。 
大 多 数 程序 设计 语言 都 提供 了 声明 局 部 变量 和 全 局 变量 的 方法 。] 

大 多 数 现代 程序 设计 语言 都 允许 只 通过 写 出 函数 名 来 调用 函数 。 例 如 ， 如 果 GetNames、 
SortNames 和 WriteNames 分 别 是 获取 、 排 序 及 打印 名 字 列 表 的 函数 的 名 字 ， 那 么 获取 、 排 序 
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及 打印 该 列表 的 程序 就 可 以 写成 : 


GetNames () 
SortNames () 
WriteNames () 


注意 ， 通 过 为 每 一 个 函数 指定 一 个 可 以 描述 该 函数 功能 的 名 字 ， 这 种 简明 扼要 的 形式 看 起 
来 就 像 是 反映 该 程序 含义 的 命令 序列 。 


6.3.2 ”参数 


函数 通常 会 使 用 一 些 通 用 项 ， 这 些 项 只 有 在 函数 被 执行 的 时 候 才 可 以 确定 下 来 。 例 如 ， 前 
面 第 5 章 中 的 图 5$-11 所 表达 的 就 是 一 个 通用 列表 而 不 是 一 个 特定 列表 。 在 本 书 的 伪 代 码 中 ， 这 些 
通用 项 都 是 在 函数 头 的 插 号 中 标识 出 来 的 。 因 此 ， 图 5-11 中 的 函数 头 以 

def Sort (List) : 


开始 ， 然 后 使 用 List 指 向 需要 排序 的 列表 ， 从 而 进一步 描述 列表 排序 过 程 。 如 果 用 这 个 函数 来 
为 一 个 婚礼 宾客 列表 排序 ， 我 们 只 需要 假设 通用 项 List 指 向 的 是 婚礼 宾客 列表 。 如 果 要 排序 一 
个 会 员 列 表 ， 我 们 只 需要 将 通用 项 List 解 释 成 该 会 员 列 表 。 

函数 内 部 的 这 些 通用 项 称 作 参数 (parameter)。 更 准确 地 说 ， 这 些 在 函数 内 部 使 用 的 项 称 为 
形 参 〈formal parameter)， 当 函数 被 调用 的 时 候 ， 赋 给 形 参 的 值 称 为 实 参 〈actual parameter)。 在 
某 种 意义 上 ， 形 参 就 像 是 函数 体 上 的 模 口 ， 当 函数 被 请 求 的 时 候 ， 实 参 就 被 塞 入 了 这 个 村 口中 。 

就 像 在 Python 中 一 样 ， 许 多 程序 设计 语言 要 求 在 定义 一 个 函数 时 将 形 参 列 在 函数 头 的 括号 
里 。 再 例如 ， 图 6-9 给 出 了 用 C 语 言 编写 的 名 字 为 ProjectPopulation 的 函数 的 定义 。 该 函数 
期 望 在 它 被 调用 的 时 候 ， 接 受 一 个 确定 的 年 增长 率 值 。 在 这 个 增长 率 的 基础 上 ， 假 设 初 始 数量 
为 100， 函 数 计 算出 未 来 10 年 中 某 个 种 群 的 数量 ， 并 且 将 结果 存储 在 称 为 population 的 全 局 数 
组 中 。 


函数 头 以 术语 “void* 开 始 ， 参 站 意 ， MA 

是 C 语 言 程序 员 指定 程序 音 i 
元 没有 返回 值 的 一 种 方式 。 说 明 每 个 参数 的 数据 类 型 
我 们 很 快 就 将 学 到 返回 值 





void ProjectPopulation . (float GrowthRate) 


jin Yeaz， 一 声明 一 个 名 为 Year 的 局 部 变量 


一 





Population[0] = 100.0; 

for (Year = 0; Year =< 10; Yeaz++) 

Population[Year+1] = Population[Year] + (Population[Year] * GrowthRate); 
} 


这 些 语句 描述 了 种 群 数量 的 计算 方法 并 将 结 
果 存 储 在 了 名 为 Population 的 全 局 数组 中 





图 6-9 用 Ci 语言 编写 的 函数 ProjectPopulation 
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大 多 数 程序 设计 语言 在 调用 函数 的 时 候 也 使 用 括号 来 标识 实 参 。 也 就 是 说 ， 调 用 函数 的 语 
名 要 包括 函数 的 名 字 并 在 紧 接 名 字 的 括号 中 给 出 实 参 的 列表 。 因 此 ， 像 


使 用 增长 率 0.03 调用 函数 ProjectPopulation () 
这 样 的 伪 代 码 语 句 可 以 用 C 语 言语 句 
ProjectPopulation (0.03); 


表示 , 它 是 用 增长 率 0.03 来 调用 图 6-9 中 的 函数 ProjectPopulation。 这 个 语法 与 Python 中 的 是 
相同 的 ， 只 是 尾部 没有 分 号 。 

当 函 数 不 只 包含 一 个 参数 的 时 候 ， 实 参 要 与 函数 头 的 形 参 序列 一 一 对 应 一 一 第 一 个 实 参 对 
应 第 一 个 形 参 ， 依 此 类 推 。 然 后 ， 实 参 的 值 就 可 以 有 效 地 转移 给 它们 对 应 的 那个 形 参 ， 从 而 函 
数 得 以 执行 。 

为 了 强调 这 一 点 ， 假 设 函 数 PrintCheck 使 用 这 样 的 函数 头 来 定义 : 

def PrintCheck (Payee, Amount): 
其 中 ，Payee 和 Amount 是 函数 的 形 参 ， 分 别 指向 收 支 票 的 人 以 及 支票 的 数额 。 那 么 ， 用 语句 


PrintCheck('John Doe', 150) 


调用 该 函数 ， 将 会 使 得 形 参 Payee 与 实 参 John Doe 对 应 ， 形 参 Amount 与 实 参 150 对 应 ， 从 而 函 
数 得 以 执行 。 但 是 使 用 语句 


printCheck (150, "John Doe") 


调用 函数 将 会 使 得 值 150 赋 给 形 参 Payee， 而 John Doe 赋 给 形 参 amount， 而 这 必定 会 导致 错误 
的 结果 。 

对 于 形 参 和 实 参 之 间 的 数据 传递 ， 不 同 的 程序 设计 语言 有 不 同 的 处 理 方法 。 在 一 些 语言 中 ， 
对 于 实 参 所 表示 的 数据 会 产生 一 个 副本 并 传 给 函数 。 使 用 这 种 方法 ， 函 数 对 数据 的 任何 修改 仅仅 
是 对 副本 的 修改 一 一 调用 程序 单元 中 的 数据 并 没有 被 修改 , 我 们 称 这 种 参数 传递 方式 为 按 值 传递 
(pass by value)。 注 意 ， 按 值 传 递 参数 可 以 保护 调用 单元 中 的 数据 ， 使 之 不 会 被 设计 不 当 的 函数 错 
误 地 修改 。 例 如 ， 如 果 调 用 单元 传递 一 个 雇员 的 名 字 给 一 个 函数 ， 我 们 当然 希望 函数 不 要 改变 这 
个 名 字 。 

不 过 ， 当 参数 表示 很 大 的 数据 块 时 ， 按 值 传 递 参数 效率 不 高 。 一 个 更 高 效 的 给 函数 传递 参 
数 的 方法 ， 就 是 在 调用 程序 单元 中 告诉 函数 它 所 需 的 实 参 的 地 址 ， 从 而 使 函数 可 以 对 实 参 进行 
直接 存 取 ， 我们 称 这 种 参数 传递 方式 为 按 引 用 传递 (pass by reference)。 注 意 ， 按 引用 传递 参数 
允许 程序 修改 调用 单元 中 的 数据 。 这 个 方法 对 于 为 列表 进行 排序 的 函数 来 说 是 很 有 用 的 ， 因 为 
调用 这 样 的 函数 目的 就 是 改变 列表 。 

举 一 个 例子 ， 假 设 函 数 Demo 的 定义 为 : 


def Demo (Formal): 








Formal = Formal + 1 
此 外 ， 假 设 变 量 Actual 被 赋予 一 个 值 5， 我 们 用 下 面 的 语句 调用 Demo: 
Demo (Actual) 


那么 ， 如 果 参 数 是 按 值 传递 的 ， 在 函数 中 对 Formal 的 改变 不 会 影响 变量 Actual 的 值 ( 见 图 6-10)。 
但 是 ， 如 果 是 按 引 用 传递 的 话 ， 那 么 Actual 的 值 将 会 增加 1 ( 见 图 6-11)。 


6.3 ”过程 单元 205 











调用 环境 函数 的 环境 调用 环境 函数 的 环境 
J We 0 由 | 
5 AT 5 ls si 
(a) 当 函 数 被 调用 时 ， 函 数 得 到 的 是 该 数据 的 副本 (a) 当 函 数 被 调用 时 ， 形 参 变 成 对 实 参 的 引用 
调用 环境 函数 的 环境 调用 环境 函数 的 环境 
[ 奖 汪 
5 人 6 6 加 
(b) 函数 操控 的 是 数据 的 副本 (b) 于 是 ， 该 函数 所 做 的 改变 是 针对 实 参 的 
调用 环境 调用 环境 
; 人 1 演 关 | 人， 
5 也 | 6 | 1 人 
(c) 于 是 ， 当 函数 终止 时 ， 调 用 环境 没有 改变 (0) 因此 ， 在 函数 终止 后 函数 所 做 的 改动 被 保留 了 下 来 
图 6-10 ”执行 函数 Demo， 按 值 传递 参数 图 6-11 执行 函数 Demo， 按 引用 传递 参数 







oy 它 的 预定 义 组 件 ( 如 按钮 
动 条 等 ) 构建 应 用 程序 ， 并 且 可 以 通过 描 响应 不 同 

对 于 按钮 而 言 ， 程 序 员 可 以 描述 单 击 按钮 时 会 于 
和 下级 作 攀 于 人 人 的 和 只是 当 信人 





语 ，Visual Basic 的 后 续 者 ， 各 VBJNET， 仍 做 是 一 种 受 隐 包 # 


不 同 的 程序 设计 语言 提供 了 不 同 的 参数 传递 技术 ， 但 是 在 任何 情况 下 ， 参 数 的 使 用 都 允许 
函数 以 通用 的 意义 书写 ， 并 在 适当 的 时 候 应 用 于 特定 的 数据 。 


6.3.3 ”有 返回 值 的 函数 


让 我 们 暂停 一 下 来 考虑 函数 概念 的 一 个 微小 的 变化 ， 该 变化 存在 于 许多 程序 设计 语言 
有 时 ， 函 数 的 目的 是 要 产生 一 个 值 ， 而 不 是 完成 一 个 动作 。( 考 虑 这 样 两 个 函数 之 间 的 差别 ， 一 
个 函数 是 估计 售 出 的 小 商品 的 数量 ， 另 一 个 函数 用 来 玩 一 个 小 游戏 ， 前 者 重点 是 为 了 产生 一 个 
值 , 而 后 者 是 为 了 完成 一 个 动作 。) 实际 上 , 计算 机 科学 中 的 函数 一 词 来 自 于 数学 中 的 函数 概念 ， 
默认 情况 下 ， 它 是 一 个 输入 集 和 一 个 输出 集 之 间 的 关系 。 从 这 个 意义 上 讲 ， 到 目前 为 止 ， 我 们 
定义 的 所 有 Python 示例 和 伪 代 码 示例 都 是 函数 的 特例 ， 这 些 例 子 没有 考虑 输出 值 和 返回 值 。( 技 
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术 上 ， 所 有 Python 函数 都 会 返回 值 ， 因 此 都 适合 用 数学 术语 函数 来 称呼 。 不 包含 return 语 句 的 
函数 返回 默认 值 None。) 在 程序 设计 语言 的 家 族 树 中 ， 有 许多 用 于 区 分 这 两 种 不 同类 型 的 程序 
单元 的 术语 。 在 有 影响 力 的 Pascal 语 言 中 ， 术 语 过 程 (procedure) 专门 用 来 指 没 有 返回 值 的 子 程 
序 。C 和 Java 使 用 关键 字 void 来 标记 没有 返回 值 的 函数 或 方法 。Python 程 序 员 有 时 用 术语 有 返回 
值 的 函数 〈fruitful function ) 来 称呼 那些 有 返回 值 的 函数 ， 以 示 区 分 。 不 管 语 言 专用 的 术语 是 什 
么 ， 大 多 数 语言 起 名 的 时 候 都 有 同样 的 想法 一 一 一 个 程序 单元 将 值 作为 “函数 值 ”传递 回调 用 
程序 单元 。 也 就 是 说 ， 函 数 的 执行 就 是 计算 出 一 个 值 并 且 将 这 个 值 送 回 到 调用 程序 单元 中 。 这 
个 值 可 以 存储 在 一 个 变量 里 为 以 后 使 用 ， 也 可 以 立即 用 于 计算 。 例 如 ，C、C++、Java 或 者 C# 
的 程序 员 可 以 编写 

ProjectedJanSales = EstimatedSales (January); 
来 把 调用 函数 Estimatedsales 产 生 的 结果 赋值 给 变量 ProjectedJanSales, 以 确定 一 月 份 预 
计 出 售 多 少 件 小 商品 。 或 者 ， 程 序 员 可 以 编写 

it (LastJanSales < EstimatedSales (January))... 

lB sa.s 


依据 今年 1 月 份 的 销售 是 否 好 于 去 年 同期 来 产生 不 同 的 动作 。 注意, 在 第 二 种 情况 中 ， 由 函数 计 
算出 来 的 值 是 用 来 确定 应 该 执行 哪个 分 支 的 ， 不 会 被 存储 起 来 。 

在 程序 中 定义 有 返回 值 的 函数 的 方式 与 定义 无 返回 值 的 函数 的 方式 基本 相同 。 它 们 的 不 同 
仅仅 在 于 ， 前 者 的 函数 头 通常 以 指定 返回 值 的 数据 类 型 开始 ， 函 数 定义 通常 以 明确 指定 返回 值 
的 zeturn 语 句 来 结束 。 图 6-12 给 出 了 一 个 名 为 CylinderVolume 的 函数 的 定义 ， 可 能 是 用 C 语 
言 写 的 。( 实 际 上 ，C 程 序 员 会 使 用 一 种 更 简洁 的 方式 ， 我 们 之 所 以 使 用 这 种 详细 的 样式 是 为 了 
教学 的 需要 。) 当 函 数 被 调用 的 时 候 ， 函 数 的 形 参 Radius 和 Height 接 收 确定 的 值 ， 函 数 使 用 这 
些 尺寸 计算 汽缸 容积 并 返回 这 个 计算 结果 。 因 此 ， 在 程序 的 其 他 地 方 ， 可 用 类 似 下 面 的 语句 : 

Cost = CostPerVolUnit * CylinderVolume (3.45, 12.7); 


来 调用 这 个 函数 ， 求 出 一 个 半径 为 3.45， 高 为 12.7 的 汽 氏 内 所 盛 物体 的 成 本 。 


函数 头 以 要 返回 数 
据 的 类 型 作为 开始 










float CylinderVolume (float Radius，float Height) 
{ float Volume; | 一直 明 一 个 名 为 folimie 


的 局 部 变量 
Volume = 3.14 * Radius * Radius * Height; 
lt 牌 汽 和 容 并 
return Volume; 计算 汽缸 的 容 和 


} | 


变量 Volume 的 值 | 
图 6-12 ”用 C 语 言 编写 的 有 返回 值 的 函数 CylinderVolume 








在 前 儿童 ， 我 们 使 用 了 儿 个 有 返回 信和 的 Python 内 置 函数 的 例子 ， 包 括 input (函数 
math.sqrt () 函数 ， 但 是 我 们 还 没有 定义 一 个 我 们 自己 的 函数 。 图 6-12 中 的 CylinderVolume 





函数 的 Python 版 本 为 : 


def CylinderVolume (Radius, Height): 
Volume = math.pi * Radius * Radius * Height 


return Volume 


ee 





文中 ， 在 我 们 已 经 考虑 过 的 情况 中 ， 函 数 的 激活 都 是 程序 中 其 他 位 置 的 语句 显 式 调用 该 
函数 的 结果 。 此 外 ， 还 有 一 些 情况 是 这 样 的 ， 函 数 是 由 一 个 事件 的 发 生 隐 式 激 活 的 ， 例 如 ， 
在 GUI 中 ， 有 种 函数 糙 述 了 当 一 个 按钮 被 单 击 的 时 候 应 该 产生 什么 动作 ， 这 种 函数 不 是 由 其 
他 程序 单元 调用 激活 的 ， 而 是 由 单 击 按钮 这 一 事件 的 结果 激活 的 .这 种 其 函数 是 通过 事件 而 
不 是 显 式 请 求 来 激活 的 软件 系统 称 作 事件 驱动 (event-driven ) 系统 ， 简 言 之 ,一 个 事件 驱动 
软件 系统 是 由 这 样 的 函数 组 成 的 :它们 描述 各 种 事件 发 生 时 应 该 做 什么 。 当 系统 执行 时 ， 这 
些 函 数 一 直 处 于 休 限 状态 ， 直 到 与 它们 对 应 的 事件 发 生 ， 然 后 它们 被 激活 ， 并 在 完成 它们 的 
任务 后 回 到 休眠 状态 。 


问题 与 练习 

1. 变量 作用 域 是 什么 ? 

2. 函数 和 有 返回 值 的 函数 的 区 别 是 什么 ? 

3. 为 什么 许多 程序 设计 语言 执行 WO 操作 的 方式 很 像 是 调用 函数 ? 

4. 形 参 和 实 参 的 区 别 是 什么 ? 

5. 按 引用 调用 传递 参数 的 函数 与 按 值 调用 传递 参数 的 函数 的 区 别 是 什么 ? 


va RT TE eT RN 


6.4 语言 实现 








在 本 节 中 ， 我 们 将 研究 把 高 级 语言 编写 的 程序 转换 为 机 器 可 执行 形式 的 过 程 。 
6.4.1 翻译 过 程 

将 一 个 程序 从 一 种 语言 转换 为 另 一 种 语言 的 过 程 称 为 翻译 〈translation)， 原 始 形式 的 程序 
称 作 源 程序 (source program)， 翻 译 后 的 版 本 称 作 目 标 程序 (object program)。 翻 译 过 程 包括 3 
个 活动 ， 它 们 分 别 是 词法 分 析 、 语 法 分 析 和 代码 生成 ,翻译 器 中 实现 这 3 个 活动 的 相应 单元 分 别 
称 为 词法 分 析 器 (lexical analyzer)、 语 法 分 析 器 (parser)， 以 及 代码 生成 器 (code generator )， 
见 图 6-13。 






源 程序 ， 一 语法 分 析 闫 一 一 履 请 法 分 析 句 一 一 代码 生成 器 一 | 目标 程序 
未 1 分 析 栅 ' 
图 6-13 ”翻译 过 程 


词法 分 析 是 识别 源 程序 中 构成 单个 实体 一 一 标记 token) 一 一 的 符号 串 的 过 程 。 例 如 ，3 
个 符号 的 153 不 应 该 解释 成 一 个 1、 一 个 5 和 一 个 3， 而 是 应 该 识别 为 一 个 数值 。 同 样 ， 程 序 中 的 
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一 个 单词 ， 尽 管 由 独立 的 符号 组 成 ， 也 应 该 解释 成 一 个 单元 。 大 多 数 人 进行 词法 分 析 都 是 下 意 
识 的 。 当 要 求 大 声 朗 读 的 时 候 ， 我 们 读 出 来 的 都 是 词 ， 而 不 是 单个 的 字母 。 

因此 ， 词 法 分 析 器 逐个 符号 地 读 源 程序 ， 识 别 出 哪 些 符 号 的 组 合 可 以 代表 一 个 标记 ， 然 后 
根据 它们 是 否 是 数值 、 词 、 算 术 运 算 符 等 将 这 些 标 记分 类 。 词 法 分 析 器 对 每 一 个 标记 及 其 分 类 
进行 编码 ， 并 将 它们 提交 给 语法 分 析 器 。 在 此 过 程 中 ， 词 法 分 析 器 会 跳 过 所 有 的 注释 语句 。 

因此 ， 语 法 分 析 器 将 程序 看 作 是 由 词法 单元 (标记) 组 成 的 ， 而 不 是 由 独立 符号 组 成 的 。 
语法 分 析 器 的 工作 就 是 将 这 些 单 元 组 合成 语句 。 实 际 上 ， 语 法 分 析 是 标识 程序 中 的 语法 结构 和 
辨认 每 个 成 分 作用 的 过 程 。 正 是 语法 分 析 技 术 使 人 们 在 读 句 子 

The man the horse that won the race threw was not hurt. 

时 ， 会 停顿 一 下 。( 试 一 试 这 句 话 : “That that is is. That that is not is not. That that is not is not that 
that is.”!) 

为 了 简化 语法 分 析 过 程 ， 早 期 程序 设计 语言 坚持 将 每 条 程序 语句 以 一 种 特定 的 方式 定位 在 
打印 页 上 ， 这 种 语言 称 为 固定 格式 语言 (fixed-format language)。 现 在 ， 大 多 数 程序 设计 语言 都 
是 自由 格式 语言 (free-format language)， 这 意味 着 不 再 苛求 语句 的 位 置 安排 了 。 从 人 的 角度 来 
看 ， 自 由 格式 语言 的 好 处 在 于 程序 员 可 以 编写 可 读 性 更 高 的 程序 。 在 这 种 情况 下 ， 通 常 使 用 缩 
进来 帮助 读者 更 好 地 把 握 语句 的 结构 。 程 序 员 不 应 该 写 

if Cost < CashonHand then pay with cash else use credit card 


而 应 该 写 


if Cost < CashonHand 
then pay with cash 
else use credit card 


要 想 让 机 器 来 分 析 以 自由 格式 语言 编写 的 程序 ， 就 必须 设计 一 种 程序 设计 语言 的 语法 ， 使 
得 无 论 源 程序 中 使 用 多 少 空格 ， 机 器 都 能 识别 出 程序 的 结构 。 为 此 ， 大 多 数 自由 格式 语言 都 使 
用 诸如 分 号 这 样 的 标点 符号 来 表示 语句 的 结束 ， 另 外 还 使 用 诸如 ifE、then 和 else 这 样 的 关键 
字 (key word) 来 表示 单个 短语 的 开始 ， 这 些 关 键 字 通常 都 是 保留 字 (reserved word)， 即 程序 
员 在 程序 中 不 能 把 它们 用 于 其 他 目的 。Python 在 这 方面 不 同 寻常 ， 虽 然 它 有 自由 格式 语言 的 特 
点 ， 但 它 严 格 要 求 用 缩 进而 不 是 用 分 号 和 大 括号 这 样 的 标点 符号 来 表示 结构 。 

语法 分 析 过 程 是 根据 一 系列 的 规则 进行 的 ， 这 些 规则 定义 了 程序 设计 语言 的 语法 。 总 地 来 
说 ， 这 些 规 则 称 为 文法 (grammar)。 表 达 这 些 规则 的 一 种 方法 是 借助 语法 图 (syntax diagram )， 
它 是 语言 文法 结构 的 图 形 化 表示 。 图 6-14 给 出 了 第 5 章 Python if-else 语 句 的 语法 图 。 这 个 图 表明 
if-else 结 构 的 开始 是 单词 1-£， 然 后 是 一 个 布尔 表达 式 ， 接 着 是 冒号 ， 随 后 是 缩 进 语句 。 此 结构 
的 后 面 有 没有 单词 else 及 其 后 面 的 冒号 和 缩 进 语句 ， 都 是 允许 的 。 注 意 ， 实 际 出 现在 让 else 语 
名 中 的 项 都 在 顶 圆 形 框 中 ， 而 需要 进一步 描述 的 项 ， 如 布尔 表达 式 和 缩 进 语句 等 ， 都 在 矩形 
框 中 。 需 要 进一步 描述 的 项 (和 矩形 框 中 的 那些 项 ) 称 为 非 终 结 符 (nonterminal)， 而 出 现在 椭圆 
形 框 中 的 项 称 为 终结 符 〈terminal)。 在 一 个 程序 设计 语言 语法 的 完整 描述 中 ， 非 终结 符 由 额外 
的 图 表 描 述 。 





图 6-14 Python 的 if-else 语 句 的 语法 图 


6.4 语言 实现 209 


作为 一 个 比较 完整 的 例子 ,图 6-15 给 出 了 一 组 语法 图 ， 它 们 描述 了 一 个 称 为 表达 式 ( 可 
以 是 简单 的 算术 表达 式 结构 ) 的 结构 的 语法 。 第 一 个 图 描述 了 一 个 表达 式 ， 这 个 表达 式 由 一 
个 项 (term) 组 成 ， 后 面 可 以 跟 〈 也 可 以 不 跟 ) 一 个 + 号 或 -号 ， 运 算 符 后 面 跟 有 另 一 个 表达 
式 。 第 二 个 图 描述 了 一 个 项 ， 这 个 项 由 单个 因子 组 成 ， 或 者 由 一 个 因子 后 面 跟 一 个 x 号 或 = 号 ， 
然后 再 跟 另 一 个 项 组 成 。 最 后 一 个 图 描述 了 一 个 因子 ， 这 个 因子 由 x、Y 或 z 中 的 一 个 符号 


组 成 。 





图 6-15 ”描述 简单 代数 表达 式 的 语法 图 





= 可 L 可 . qd 站 
eis A 


一 个 特定 的 串 符合 一 组 语法 图 的 方式 还 可 以 用 语法 分 析 树 (parse tree) 进行 图 形 化 表示 ， 
根据 图 6-15 中 所 示 的 语法 图 ， 图 6-16 描 述 了 字符 串 x+yxz 的 语法 分 析 树 。 注 意 , 树 的 顶端 以 非 终 
结 符 表达 式 开始 ， 并 且 在 每 一 层 都 给 出 了 本 层 的 非 终 结 符 是 如 何 分 解 的 ， 这 个 过 程 直到 获得 该 
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串 本 身 中 的 全 部 符号 才 结 束 。 该 图 还 特别 说 明 
(根据 图 6-15 中 的 第 一 个 图 ), 一 个 表达 式 可 以 分 
解 成 一 个 项 ， 后 面 跟 有 + 号 ， 然 后 再 跟 一 个 表达 
式 。 接 着 ， 项 可 以 分 解 成 〈 用 图 6-15 中 的 第 二 个 
图 ) 一 个 因子 (结果 是 符号 x)， 最 后 的 表达 式 可 
以 分 解 〈 用 图 6-15 中 的 第 三 个 图 ) 为 一 个 项 〈 结 
果 是 yxz)。 

一 个 程序 的 语法 分 析 过 程 本 质 上 就 是 为 源 
程序 构建 语法 分 析 树 的 过 程 。 的 确 , 一 个 语法 分 
析 树 代表 了 语法 分 析 器 对 程序 文法 构成 的 理解 。 
因此 , 描述 程序 文法 结构 的 语法 规则 是 不 允许 同 
一 个 串 出 现 两 个 不 同 的 语法 分 析 树 的 , 因为 这 将 
导致 语法 分 析 器 内 部 产生 歧义 。 对 于 允许 同一 个 
串 有 两 个 不 同 的 语法 分 析 树 的 方法 , 我 们 称 之 为 
多 义 文法 (ambiguous grammar)。 

文法 中 的 歧义 性 很 微妙 。 事 实 上 ， 图 6-14 中 
所 示 的 规则 存在 这 样 的 缺陷 , 对 于 下 面 的 语句 可 
以 生成 如 图 6-17 所 示 的 两 个 语法 分 析 树 : 


££ Bl: ££ Bla: SI elSe S2 














if ”| 布 乐 表达 式 





if 布尔 表达 式 
| 


B2 


图 6-17 语句 if B1: if B2: 


“IN 





表达 式 
| | 
因子 项 
x 因子 2 项 
因子 


z 


图 6-16 ”基于 图 6-15 的 串 x+yxz 的 语法 分 析 树 


else: 语句 
| 


S1 S2 


Sl else: S2 的 两 个 不 同 的 语法 分 析 树 
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注意 ， 这 两 个 解释 是 明显 不 同 的 。 第 一 个 表示 语句 $2 在 B81 为 假 时 执行 ， 而 第 二 个 表示 语句 
52 仅 当 B1 为 真 且 B2 为 假 时 执行 。 
正式 的 程序 设计 语言 的 语法 定义 要 避免 这 样 的 歧义 。 在 Python 中 ， 我 们 通过 使 用 缩 进 来 避 
免 这 样 的 问题 。 特 别 是 ， 我 们 可 以 写 
4 Bl: 
B22 
S1 


else: | 
S2 


以 及 
1 Bia 
i 国信 
S1 


else: 
S2 


来 区 分 这 两 种 可 能 的 解释 。 

当 语法 分 析 器 分 析 一 个 程序 的 文法 结构 时 ， 它 能 够 标识 单独 的 语句 ， 并 能 够 区 分 声明 语句 
和 命令 语句 。 当 识别 声明 语句 时 ， 它 将 这 些 声明 的 信息 记录 在 一 个 符号 表 〈symbol table) 中 。 
因此 符号 表 中 包含 了 这 样 的 信息 : 程序 中 出 现 的 变量 名 以 及 与 这 些 变量 相关 的 数据 类 型 和 数据 
结构 。 然 后 ， 当 语法 分 析 器 分 析 到 

吕 三 驴 和 六 
这 样 的 命令 语句 时 ,会 以 这 些 信息 为 依据 来 进行 分 析 。 特 别 是 ， 为 了 确定 符号 + 的 含义 ， 语 法 分 
析 器 必须 要 知道 x< 和 y 的 数据 类 型 。 如 果 x 是 浮 点 型 而 y 是 字符 型 ， 那 么 x 和 y 相 加 没有 任何 意义 ， 
程序 会 报告 出 错 ; 如 果 x 和 y 都 是 整 型 ， 那 么 语法 分 析 器 将 会 请 求 代码 生成 器 用 机 器 的 整数 加 法 
操作 码 生 成 相应 的 机 器 语言 指令 ;如果 x 和 y 都 是 浮 点 型 ， 那 么 语法 分 析 器 将 会 请 求 代码 生成 器 
用 机 器 的 浮 点 数 加 法 操作 码 生成 相应 的 机 器 语言 指令 ;如 果 都 是 字符 型 ， 语 法 分 析 器 将 会 请 求 
代码 生成 器 建立 一 串 机 器 语言 指令 来 完成 相应 的 连接 操作 。 

如 果 zx 是 整 型 而 y 是 浮 点 型 这 种 特殊 的 情况 ， 那 么 加 法 的 概念 是 可 用 的 ， 但 是 值 不 能 以 
兼容 的 形式 编码 。 在 这 种 情况 下 ,语法 分 析 器 可 能 会 选择 让 代码 生成 器 生成 指令 把 其 中 的 一 
个 值 转 换 为 另 一 种 类 型 ， 然 后 再 执行 加 法 运算 ， 这 种 隐 式 的 类 型 转换 称 为 强制 类 型 转换 
(coercion ) 。 

许多 程序 设计 语言 的 设计 者 都 反对 强制 类 型 转换 ， 因 为 隐 式 类 型 转换 会 改变 数据 项 的 值 ， 
并 因此 导致 微妙 的 程序 bug。 他 们 认为 , 需要 强制 类 型 转换 通常 就 意味 着 程序 在 设计 上 存在 缺陷 ， 
所 以 不 应 该 让 语法 分 析 器 来 迁就 。 因 此 ， 大 多 数 现代 程序 设计 语言 都 是 强 类 型 (strongly typed ) 
的 , 这 意味 着 一 个 程序 请 求 的 所 有 活动 都 必须 包含 一 致 类 型 的 数据 ,一 些 程序 设计 语言 (如 Java) 
支持 进行 强制 类 型 转换 ， 只 要 它 是 类 型 提升 〈type promotion)， 意 思 是 将 一 个 低 精 度 值 转换 为 
一 个 较 高 精度 的 值 。 可 能 改变 一 个 值 的 隐 式 强制 类 型 转换 将 被 报告 为 错误 。 在 大 多 数 情况 下 ， 
程序 员 仍 可 以 请 求 这 种 类 型 转换 ， 方 法 是 进行 显 式 类 型 转换 (type cast)。 显 式 类 型 转换 会 通知 
编译 器 : 程序 员 知道 将 应 用 类 型 转换 。 

翻译 过 程 的 最 后 一 步 就 是 代码 生成 (code generation)， 它 是 生成 机 器 语言 指令 以 实现 语法 
分 析 器 能 识别 的 语句 的 过 程 。 这 个 过 程 涉及 许多 问题 ， 其 中 一 个 就 是 要 生成 高 效 的 机 器 语言 
本 的 程序 。 例 如 ， 我 们 考虑 一 个 转换 双语 名 序列 
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总 二 蕊 
的 翻译 工作 。 如 果 这 两 条 语句 作为 两 个 独立 的 语句 来 进行 翻译 ， 那 么 在 执行 加 法 操作 之 前 ， 每 
一 条 语句 都 需要 数据 从 主 存储 器 传送 到 CPU。 然 而 ， 效 率 可 以 通过 这 样 的 认识 获得 : 一 旦 第 一 
条 语句 被 执行 之 后 ，x 和 z 的 值 就 已 经 在 CPU 的 通用 寄存 器 中 了 ， 所 以 执行 第 二 条 语句 的 时 候 就 
不 再 需要 从 内 存 中 加 载 这 两 个 数 了 。 这 种 方法 就 称 作 代码 优化 (code optimization)， 它 是 代码 
生成 器 的 一 个 很 重要 的 任务 。 

最 后 ， 我 们 应 当 注 意 的 是 ， 词 法 分 析 、 语 法 分 析 和 代码 生成 这 3 个 活动 并 不 是 严格 按照 顺 
序 执行 的 。 相 反 ， 这 些 活动 是 交织 在 一 起 的 。 词 法 分 析 器 首先 从 源 程序 中 读 取 字 符 ， 并 且 标 识 
出 第 一 个 标记 。 它 将 这 个 标记 传送 给 语法 分 析 器 。 每 当 语 法 分 析 器 从 词法 分 析 器 接收 到 一 个 标 
记 时 ， 就 开始 分 析 读 取 的 文法 结构 。 此 时 ， 它 可 能 会 向 词法 分 析 器 请 求 另 一 个 标记 ， 而 如 果 语 
法 分 析 器 认为 已 经 读 到 了 一 个 完整 的 短语 或 者 语句 ， 那 么 它 就 会 请 求 代码 生成 器 产生 相应 的 机 
器 指令 。 每 一 个 这 样 的 请 求 都 会 使 代码 生成 器 生成 机 器 指令 ， 并 且 将 其 加 入 到 目标 程序 中 。 将 
一 个 程序 从 一 种 语言 翻译 成 另 一 种 语言 的 任务 自然 符合 面向 对 象 范 型 。 源 程序 、 词 法 分 析 器 、 
语法 分 析 器 、 代 码 生 成 器 以 及 目标 程序 本 身 都 是 对 象 ， 每 一 个 对 象 都 在 实现 自己 的 任务 的 同时 
通过 来 回 发 送 消息 与 其 他 对 象 进行 交互 〈 见 图 6-18 )。 


| yy 


语法 分 析 器 
目标 程序 


图 6-18 ”翻译 过 程 的 面向 对 象 方法 
6.4.2 软件 开发 包 


像 编辑 器 和 翻译 器 这 样 的 在 软件 开发 过 程 中 应 用 的 软件 工具 ， 通 常会 组 合成 一 个 软件 包 ， 
起 到 一 个 集成 软件 开发 系统 的 作用 。 根 据 3.2 节 中 的 分 类 方案 ， 这 样 的 系统 属于 应 用 软件 。 通 过 使 
用 该 应 用 软件 包 ， 程 序 员 可 以 很 方便 地 在 一 个 编辑 器 中 编写 程序 ， 使 用 翻译 器 将 程序 转换 成 机 
器 语言 ， 并 且 可 以 使 用 各 种 各 样 的 调试 工具 来 跟踪 故障 程序 的 执行 ， 以 发 现 哪里 出 现 了 问题 。 

使 用 这 样 的 集成 系统 的 好 处 很 多 ， 最 明显 的 就 是 程序 员 在 需要 修改 和 测试 程序 时 ， 可 以 很 
容易 地 在 编辑 器 和 调试 工具 之 间 来 回 倒 换 。 此 外 ， 许 多 软件 开发 包 人 允许 开发 中 的 相关 程序 单元 
以 合适 的 方式 链接 ， 以 便 简化 对 相关 程序 单元 的 存 取 。 一 些 软 件 包 还 维护 这 样 的 记录 ， 即 自 上 
次 基准 制定 以 来 ， 一 组 相关 程序 单元 中 哪些 已 经 做 了 修改 。 对 于 许多 相关 程序 单元 是 由 不 同 程 
序 员 开 发 的 大 型 软件 系统 的 开发 来 说 ， 这 些 功 能 是 非常 有 用 的 。 

从 小 范围 讲 ， 软 件 开发 包 中 的 编辑 器 通常 根据 正在 使 用 的 程序 设计 语言 进行 定制 。 这 样 的 
编辑 器 通常 提供 自动 的 行 缩 进 功能 ， 这 已 成 为 目标 语言 事实 上 的 标准 ， 有 时 ， 程 序 员 键入 前 面 
几 个 字符 之 后 ， 编 辑 器 就 能 够 识别 并 自动 补 全 关键 字 。 此 外 ， 编 辑 器 可 以 突出 显示 源 程序 中 的 
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关键 字 (也许 是 使 用 颜色 )， 使 程序 易 读 。 

在 下 一 章 中 ， 我 们 将 会 学 到 软件 开发 人 员 越 来 越 多 地 研究 这 样 的 方法 ， 即 如 何 用 预制 的 称 
为 构件 的 程序 块 构 建新 的 软件 系统 ， 这 导致 了 一 种 新 的 称 为 构件 架构 的 软件 开发 模型 的 产生 。 
基于 构件 架构 模型 的 软件 开发 包 通 常 使 用 图 形 界面 ， 在 显示 器 屏幕 上 用 图 标 表示 各 种 构件 。 在 
这 种 环境 下 ， 程 序 员 〈 或 者 构件 装配 人 员 ) 用 鼠标 选择 所 需要 的 构件 。 选 好 的 构件 可 以 用 软件 
开发 包 的 编辑 器 进行 定制 ， 然 后 用 鼠标 进行 定位 和 单 击 就 可 以 加 到 其 他 构件 上 。 这 种 软件 包 代 
表 了 在 寻求 更 好 的 软件 开发 工具 的 方向 上 前 进 了 一 大 步 。 





6.5 面向 对 象 程序 设计 





在 6.1 节 中 ， 我 们 看 到 面向 对 象 范 型 必然 需要 开发 称 为 对 象 〈object) 的 活动 程序 单元 ， 每 
一 个 对 象 都 包含 了 描述 对 象 怎样 响应 各 种 刺激 的 函数 。 一 个 问题 的 面向 对 象 解决 方法 就 是 标识 
出 涉及 的 对 象 ， 并 将 其 作为 一 个 独立 的 单元 来 描述 。 接 着 ， 面 向 对 象 程序 设计 语言 提供 了 描述 
对 象 及 其 行为 的 语句 。 在 本 节 中 ， 我 们 将 引入 一 些 以 C++、Java 和 C# 语 言 形 式 出 现 的 语句 ， 这 3 
种 语言 都 是 当今 比较 著名 的 面向 对 象 程序 设计 语言 。 


6.5.1 类 和 对 和 象 


我 们 可 以 考虑 开发 一 个 简单 的 计算 机 游戏 的 任务 ， 在 这 个 游戏 中 ， 玩 家 要 通过 高 功率 激光 
器 向 从 天 上 掉 下 来 的 流星 进行 射击 来 保卫 地 球 。 每 个 激光 器 都 有 一 定 的 内 部 能 源 ， 而 每 一 次 射 
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击 都 将 消耗 一 部 分 能 源 。 一 旦 能 源 用 尽 ， 激 光 器 就 没有 用 了 。 每 一 个 激光 器 都 应 该 能 响应 瞄准 
右面 一 点 、 瞄 准 左面 一 点 和 发 射 激 光束 的 命令 。 

在 面向 对 和 象 范 型 中 ， 计 算 机 游戏 中 的 每 一 束 激光 都 将 实现 为 一 个 对 象 ， 每 个 这 样 的 对 象 都 
包含 了 它 的 剩余 能 量 的 记录 以 及 修改 目标 和 发 射 激光 束 的 函数 。 由 于 所 有 的 激光 对 象 都 有 同样 
的 属性 ， 所 以 可 以 使 用 一 个 通用 的 模板 来 描述 它们 。 在 面向 对 象 范 型 中 ， 这 样 的 一 组 对 象 的 模 
板 称 作 类 (class)。 

在 第 8 章 , 我 们 将 探究 类 和 数据 类 型 之 间 的 相似 点 。 现 在 , 我 们 只 需要 注意 类 描述 的 是 一 组 
对 象 的 共同 特征 ， 这 与 基本 数据 类 型 整 型 的 概念 包含 像 数字 1、5 和 82 这 样 的 数 的 一 般 特 征 类 似 。 
一 旦 程序 员 在 程序 里 面包 含 一 个 类 的 描述 ， 那 个 模板 就 可 以 用 来 构建 和 操作 那 一 “类 型 ”的 对 
象 ， 这 相当 于 基本 的 整 型 允许 操作 整 型 的 “对 象 ”。 

在 C++、Java 和 C# 语 言 中 ， 类 使 用 下 列 形式 的 语句 来 描述 : 

class Name 


{ 


} 
其 中 ，Name 是 一 个 名 字 ， 在 程序 的 其 他 地 方 可 通过 这 个 名 字 来 引用 该 类 。 大 括号 中 是 被 描述 的 
类 的 属性 。 图 6-19 特 别 展示 了 描述 计算 机 游戏 中 激光 结构 的 名 为 Laserclass 的 类 。 这 个 类 包含 
1 个 名 字 为 RemainingPower 的 ( 整 型 ) 变量 以 及 3 个 名 字 分 别 为 turnRight、 turnLeft 和 fire 
的 函数 的 声明 ， 这 些 函数 描述 了 完成 相应 动作 的 执行 步骤 。 因 此 ， 任 何 一 个 从 该 模板 构建 的 对 
象 都 包含 如 下 特性 : 1 个 名 字 为 RemainingPower 的 变量 以 及 3 个 名 字 分 别 为 turnRight、 
turnLeft 和 fire 的 函数 。 


class LaserClass 


{ int RemainingPower = 100; 
一 一 保留 在 每 个 该 “类型” 
void turnRight ( ) 对 象 里 的 数据 的 描述 


tr 


RT 描述 该 “类 型 ”对 象 应 该 如 何 
em 应 对 各 种 消息 的 方法 


void fire ( ) 





图 6-19 ”描述 计算 机 游戏 中 一 种 激光 武器 的 类 结构 


对 象 内 部 的 变量 ， 如 RemainingPower， 称 为 实例 变量 (instance variable); 对 象 里 的 函数 
称 为 方法 (method, 在 C++ 中 称 作成 员 函 数 )。 注 意 , 在 图 6-19 中 , 描述 实例 变量 RemainingPower 
的 声明 语句 类 似 于 6.2 节 中 讨论 的 声明 语句 ， 描 述 方法 的 方式 和 6.3 节 中 描述 函数 的 方式 也 比较 相 
似 。 毕 竟 ， 实 例 变量 的 声明 和 方法 的 描述 基本 上 都 是 命令 型 程序 设计 概念 。 

一 旦 我 们 在 游戏 程序 中 描述 了 类 Laserclass， 我 们 就 可 以 通过 下 列 形 式 的 语句 来 声明 3 
个 Laserclass“ 类 型 ”的 变量 Laserl、Laser2 和 Laser3: 
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LaserClass Laserl, Laser2, Laser3; 
注意 ， 这 与 我 们 在 前 面 6.2 节 中 所 学 的 声明 3 个 整 型 变量 x、y 和 z 的 语句 
4。 让 7 


的 格式 是 一 样 的 ， 它 们 都 是 由 一 个 “类 型 ”名 后 跟 一 个 将 要 声明 的 变量 列表 组 成 的 。 区 别 在 
于 ， 后 者 所 说 的 变量 x、y 和 z 在 程序 中 指向 的 是 整 型 项 (这 是 基本 类 型 )， 而 前 者 所 说 的 变量 
Laserl、Laser2 和 Laser3 在 程序 中 指向 的 是 LaserCclass“ 类 型 ”的 项 (这 是 程序 自己 定 
义 的 “类 型 ”)。 

一 旦 我 们 声明 了 Laserclass“ 类 型 ”的 变量 Laserl1、Laser2 和 Laser3， 就 可 以 给 它们 
赋值 。 在 这 种 情况 下 ， 所 赋 的 值 必须 是 与 LaserClass“ 类 型 ” 相 一 致 的 对 象 。 这 些 赋值 可 以 
通过 赋值 语句 来 进行 , 但 是 在 声明 变量 时 , 在 同一 个 声明 语句 内 给 变量 赋 初 值 通常 是 很 方便 的 。 
在 C++ 语 言 的 声明 中 ， 这 种 初始 赋值 是 自动 的 。 也 就 是 说 ， 语 句 

LaserClass. Laserl,; Laser2; Laser3; 


不 仅 创建 了 变量 Laserl1、Laser2 和 Laser3， 而 且 还 创建 了 3 个 LaserClass“ 类 型 ”的 对 象 ， 
其 中 每 一 个 作为 每 个 变量 的 值 。 在 Java 和 C# 语 言 中 ， 这 种 初始 赋值 与 对 一 个 基本 类 型 的 变量 赋 
初 值 的 方法 基本 相同 。 具 体 而 言 ， 语 句 


人 生 二 旷 
不 仅 声 明了 一 个 整 型 变量 x， 而 且 还 把 值 3 赋 给 了 这 个 变量 ;语句 
LaserClass Laserl = new LaserClass(); 


不 仅 声明 了 一 个 Laserclass“ 类 型 ”的 变量 Laserl1， 而 有 旦 还 用 Laserclass 类 模板 创建 了 一 
个 新 的 对 象 ， 作 为 初 值 赋 给 了 Laser1l。 

在 进一步 讨论 之 前 , 我 们 要 强调 一 下 类 和 对 象 之 间 的 区 别 。 类 是 一 个 模板 ， 对 象 是 由 这 
个 模板 创建 出 来 的 。 一 个 类 能 够 用 来 创建 许多 个 对 象 , 我 们 经 常 将 对 象 称 为 类 (构建 该 对 象 
的 类 ) 的 实例 (instance)。 因 此 ， 在 我 们 的 计算 机 游戏 中 ，Laserl、Laser2 和 Laser3 都 是 
变量 ， 其 值 都 是 Laserclass 类 的 实例 。 

在 用 声明 语句 创建 对 象 并 且 将 其 赋 给 变量 Laserl1、Laser2 和 Laser3 之 后 ， 可 以 通过 编 
写 命令 语句 来 激活 这 些 对 象 中 合适 的 方法 〈 在 面向 对 象 术语 中 ， 这 称 为 “向 对 象 发 送 消 息 ”)。 
具体 而 言 ， 我 们 可 用 赋 给 变量 Laser1 的 对 象 通过 以 下 语句 执行 fire 方 法 : 

Laserl,.fire();» 

或 者 ， 我 们 可 让 赋 给 Laser2 的 对 象 执行 它 的 turnLeft 方 法 ， 这 是 通过 语句 

Laser2.turnLeft () 

来 实现 的 。 这 些 实际 上 是 函数 的 调用 。 的 确 ， 前 面 一 个 语句 是 调用 赋 给 变量 Laserl 的 对 和 象 
内 部 的 函数 (方法 ) fire， 后 面 一 个 语句 则 是 调用 赋 给 变量 Laser2 的 对 和 象 内 部 的 函数 
turhLett: 

在 这 个 阶段 ， 流 星 游戏 例子 已 经 给 出 了 掌握 典型 面向 对 象 程 序 总 体 结构 的 背景 知识 ( 见 
图 6-20)。 它 包含 了 与 图 6-19 相 似 的 各 种 类 的 描述 ， 每 一 个 都 描述 了 程序 中 使 用 的 一 个 或 多 个 对 
象 的 结构 。 另 外 ， 程 序 会 包含 一 个 命令 程序 段 (通常 和 名 字 “main” 有 关 )， 这 个 命令 程序 段 包 
括 了 当 程 序 运行 时 最 初 要 执行 的 步骤 序列 。 这 个 段 包括 与 我 们 激光 类 的 声明 类 似 的 声明 语句 ， 
用 来 建立 程序 中 使 用 的 对 象 ， 还 包括 调用 那些 对 象 中 执行 方法 的 命令 语句 。 


216 第 6 章 程序 设计 语言 


程序 


过 程 单元 〈 常 称 为 main) ， 
它 指示 对 象 的 构造 并 对 它们 
的 方法 作出 合适 的 调用 





图 6-20 ”典型 的 面向 对 象 程序 的 结构 
6.5.2 ”构造 器 


当 构 造 对 象 时 ， 通 常 需要 进行 一 些 个 性 化 的 定制 。 例 如 ， 在 我 们 的 电脑 游戏 中 ， 有 可 能 需 
要 实现 一 些 具有 不 同 初始 能 量 设置 的 激光 器 ， 这 就 意味 着 不 同 对 象 中 的 RemainingPower 实 例 
变量 应 该 给 定 不 同 的 初始 值 。 这 种 初始 化 需要 通过 在 合适 的 类 中 定义 特殊 的 称 为 构造 器 
《constructor) 的 方法 来 处 理 ， 构 造 器 是 在 构建 类 的 对 象 时 自动 执行 的 。 构 造 器 这 种 方法 在 类 的 
定义 中 是 通过 使 用 与 类 名 相同 的 名 字 来 标识 的 。 

图 6-21 给 出 了 图 6-19 中 的 Laserclass 类 的 扩展 定义 。 注 意 ， 它 包括 一 个 构造 器 ， 该 构造 器 的 
形式 是 名 为 Laserclass 的 方法 。 这 个 方法 将 它 接收 的 参数 值 赋 给 了 实例 变量 RemainingPower，。 
因此 ， 当 一 个 对 象 在 类 中 构建 出 来 时 ， 这 个 方法 就 会 执行 ， 使 得 RemainingPowez 被 初始 化 为 一 个 
合适 的 值 。 


当 一 个 对 象 被 创建 时 ， 构 造 
class LaserClass 器 给 RemainingPower 赋 
{ int RemainingPower; 一 个 值 


LaserClass (InitialPower) 
‘{ RemainingPower = InitialPower; 
} 


void turnRight ( ) 
fi 


void turnLeft ( ) 
{各 记 让 


void fire ( ) 
{ew 和 mm} 





图 6-21 带 有 构造 器 的 类 
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构造 器 所 使 用 的 实 参 是 由 实际 创建 对 象 的 语句 里 的 参数 列表 标识 的 。 因 此 ， 基 于 图 6-21 中 
给 出 的 类 的 定义 ，C++ 程 序 员 将 会 编写 语句 


LaserClass Laserl(50), Laser2(100); 


来 创建 两 个 LaserClass 类 型 的 对 象 ， 一 个 是 Laser1， 初 始 能 量 值 为 50， 另 一 个 是 Laser2， 初 
始 能 量 值 为 100。 使 用 Java 和 C# 的 程序 员 完成 同样 工作 的 语句 是 : 


LaserClass Laserl new LaserClass (50); 


LaserClass Laser2 


6.5.3 ”附加 特性 


假设 我 们 需要 改进 游戏 ， 以 使 得 玩家 达到 一 定 的 分 数 时 ， 可 以 获得 奖励 为 其 现 有 的 激光 器 
补充 能 量 。 除 了 可 以 补充 能 量 以 外 ， 这 些 激光 器 与 其 他 激光 器 有 同样 的 属性 。 

为 了 简化 对 具有 相似 但 不 完全 相同 特征 的 对 象 的 描述 ， 面 向 对 象 语言 允许 一 个 类 通过 称 为 
继承 (inheritance〉 的 技术 包含 其 他 类 的 属性 。 例 如 ,假设 使 用 Java 来 开发 我 们 的 游戏 程序 ， 我 
们 可 以 先 使 用 之 前 描述 的 类 语句 来 定义 类 Laserclass， 这 个 类 描述 了 程序 中 的 所 有 激光 器 的 
共同 属性 。 接 下 来 ， 我 们 使 用 语句 

class RechargeableLaser extends LaserClass 


new LaserClass (100);，; 


} 
来 描述 另 一 个 类 RechargeableLaser。(C++ 和 C# 语 言 用 骨 号 来 代替 extends 。 ) 这 里 extends 
子 句 指明 了 这 个 类 不 仅 继承 了 类 Laserclass 的 特性 , 同时 还 包含 了 括号 中 出 现 的 特性 。 括 号 可 
以 包含 新 的 方法 (名 字 也 许 是 recharge )， 用 它 描 述 重 置 实例 变量 RemainingPower 为 其 初始 
值 的 步骤 。 一 旦 这 些 类 定义 好 了 ， 就 可 以 使 用 语句 

LaserClass Laseril, Laser2; 
来 将 变量 Laserl 和 Laser2 声 明 为 指向 原来 激光 器 的 变量 ， 并 且 使 用 语句 

RechargeableLaser Laser3, Laserd; 


来 将 变量 Laser3 和 Laser4 声 明 为 指向 拥有 类 RechargeableLaser 中 描述 的 额外 特性 的 激 
光 器 的 变量 。 

继承 的 使 用 导致 了 各 种 具有 相似 但 不 完全 相同 特征 的 对 象 的 存在 ， 也 因此 导致 了 6.2 节 中 讨 
论 的 重 载 现象 。( 让 我 们 回忆 一 下 ， 重 载 是 指使 用 一 个 符号 ， 如 +， 来 根据 操作 数 类 型 的 不 同 代 
表 不 同 的 运算 。) 假设 一 个 面向 对 象 的 图 形 开发 包 包 含 各 种 对 象 ， 每 一 个 都 代表 了 一 种 形状 ( 圆 
形 、 和 矩形 、 三 角形 等 )。 一 个 特定 的 图 像 可 能 由 一 组 这 类 对 象 构成 ， 每 个 对 和 象 都 “知道 ”自己 的 
大 小 、 位 置 和 颜色 ， 都 有 自己 响应 消息 的 方式 ， 例 如 ， 移 动 到 一 个 新 的 位 置 或 者 在 显示 器 上 夯 
出 自己 。 我 们 仅仅 对 图 像 中 的 每 个 对 象 发 送 “ 画 自己 ”的 消息 来 画图 。 但 是 ， 对 象形 状 的 不 同 
决定 了 所 使 用 的 画 一 个 对 象 的 例 程 是 不 同 的 一 一 正方 形 的 画 法 和 圆 形 的 画 法 是 不 同 的 。 这 种 对 
消息 的 自 定义 解释 称 为 多 态 ‘(polymorphism); 这 种 消息 是 多 态 的 。 封 装 〈(encapsulation) 是 与 
面向 对 象 程序 设计 相关 的 另 一 个 特性 ， 它 是 指 限 制 对 一 个 对 象 内 部 属性 的 访问 。 说 一 个 对 象 的 
特定 属性 是 封装 的 ， 意 思 是 只 有 对 象 自己 才 可 以 访问 它们 。 被 封装 的 特性 被 认为 是 私有 的 ， 而 
可 以 从 对 象 外 部 访问 到 的 特性 被 认为 是 公有 的 。 
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例如 ， 让 我 们 回 到 图 6-19 中 的 Laserclass 类 。 它 描述 了 一 个 实例 变量 RemainingPower 
以 及 3 个 方法 turnRight、turnLeft 和 fire。 这 些 方法 可 以 被 其 他 程序 单元 访问 ， 以 使 
Laserclass 的 实例 执行 合适 的 动作 。 但 是 RemainingPower 的 值 应当 只 能 由 实例 的 内 部 方法 
来 修改 ， 其 他 程序 单元 应 该 不 能 直接 访问 这 个 值 。 为 了 强制 实现 这 些 规则 ， 我 们 仅 需 要 将 
RemainingPower 指 定 为 private 而 将 turnRight、turnLeft 和 fire 指 定 为 public, 如 图 6-22 
所 示 。 通 过 这 种 设计 ， 在 程序 翻译 期 间 任何 试图 从 对 象 的 外 部 对 RemainingPower 的 值 进行 访 
问 的 操作 都 会 被 标识 为 错误 ， 并 要 求 程序 员 在 继续 进行 之 前 改正 该 错误 。 
















class LaserClass 


{, private int RemainingPower; 


public LaserClass (InitialPower) 
类 中 的 成 分 指定 为 公有 或 
是 私有 依赖 于 是 否 要 从 其 
他 程序 单元 访问 它们 


{RemainingPower = InitialPower; 
} 

public void turnRight ( ) 
过 


PUBLECE void turnLeft ( ) 
和 





Bubdie void fire ( ) 





图 6-22 ”在 Java 或 C# 程 序 中 使 用 封装 的 LasserClass 的 定义 


问题 与 练习 

1 对 象 和 类 之 间 的 区 别 是 什么 ? 

2. 在 本 节 的 计算 机 游戏 示例 中 ， 除了 Laserclass， 还 可 以 找到 什么 对 象 类 ? 除了 RemainingPower， 
，， 还 可 在 aserclass 类 中 找到 什么 实例 变量 ? 

3 假设 类 PartTimeEmployee 和 FullTimeEmployee 继 承 了 类 Employee 的 属性 。 你 可 以 想到 这 两 个 类 

中 都 有 什么 特性 ? 
4. 什么 是 构造 器 ? 
5, 为 什么 类 中 的 一 些 项 要 指定 为 private? 


rit ret 


*6.6 ”程序 设计 并 发 活动 


假设 我 们 要 为 多 路 攻击 敌人 飞船 的 计算 机 游戏 设计 一 个 生成 动画 的 程序 。 一 种 办 法 就 是 只 
设计 一 个 用 来 控制 整个 动画 屏幕 的 程序 ， 由 它 来 负责 绘制 每 一 个 飞船 ， 这 《如 果 动 画 要 做 得 很 
台 真 ) 意味 着 该 程序 必须 掌握 许多 飞船 的 各 自 特 征 。 is 
飞船 的 动画 ， 每 个 飞船 的 特征 由 参数 决定 ， 在 程序 执行 的 开始 阶段 给 参数 赋值 。 然 后 ， 动 画 可 
以 通过 创建 这 个 程序 的 多 个 激活 (activation) 来 构建 ， 每 ev er 组 参数 。 同 
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时 执行 这 些 激活 ， 我 们 就 会 得 到 有 许多 飞船 从 屏幕 上 同时 飞 过 的 假象 。 

这 种 多 个 激活 的 同时 执行 称 为 并 行 处 理 (parallel processing ) 或 并 发 处 理 (concurrent 
processing)。 真 正 的 并 行 处 理 需 要 多 个 CPU 内 核 , 每 个 CPU 内 核 执 行 一 个 激活 。 当 仅 有 一 个 CPU 
可 用 时 ， 并 行 处 理 给 我 们 的 错觉 是 允许 多 个 激活 分 享 一 个 处 理 器 的 时 间 ， 其 方式 与 通过 多 道 程 
序 设计 系统 〈 见 第 3 章 ) 来 执行 相似 。 

与 较 传统 的 单 指令 序列 环境 相 比 ， 许 多 现代 计算 机 应 用 程序 在 并 行 处 理 环境 里 解决 起 来 更 
容易 。 于 是 ， 较 新 的 程序 设计 语言 提供 了 表达 并 行 计 算 所 涉及 的 语义 结构 的 语法 。 这 种 语言 的 
设计 需要 对 这 些 语义 结构 的 识别 以 及 描述 它们 的 语法 的 开发 。 

每 一 种 程序 设计 语言 都 倾向 于 从 自己 的 角度 来 处 理 并 行 处 理 范 型 , 结果 产生 了 不 同 的 术语 。 
例如 ,， “激活” 这 个 非 正式 的 称谓 在 Ada 语 言 中 称 为 任务 (task)， 而 在 Java 语 言 中 称 为 线程 
Cthread)。 也 就 是 说 ， 在 Ada 程 序 中 ,同时 发 生 的 动作 是 通过 创建 多 个 任务 来 执行 的 ， 而 在 Java 
程序 中 是 通过 创建 多 个 线程 来 执行 的 。 在 这 两 种 情况 下 ， 结 果 都 是 多 个 活动 被 生成 和 执行 ， 
其 方式 与 多 任务 处 理 系统 控制 下 的 进程 是 一 样 的 。 我 们 将 采用 Java 中 的 术语 ， 把 这 种 “进程 ” 
都 称 为 线程 。 

也 许 ， 在 涉及 并 行 处 理 的 程序 中 必须 表达 的 大 多 数 最 基本 的 动作 就 是 创建 新 线程 。 如 果 希 
望 可 以 同时 执行 飞船 程序 的 多 个 激活 ， 那 么 就 需要 有 能 说 明 这 一 点 的 语法 。 这 种 新 线程 的 产生 
处 理 通常 与 请 求 一 个 传统 函数 的 执行 类 似 。 不 同 之 处 在 于 ， 在 传统 的 环境 中 ， 请 求 函数 激活 的 
程序 单元 在 所 请 求 的 函数 终止 之 前 不 再 往 下 执行 〈 见 图 6-8)， 而 在 并 行 环境 中 ， 请 求 程序 单元 
在 被 请 求 函 数 执行 任务 的 同时 继续 向 下 执行 〈 见 图 6-23 )。 因 此 ， 要 创建 多 个 飞船 飞 过 屏幕 的 场 


景 ， 我 们 可 以 写 一 个 主 程序 ， 该 主 程序 只 生成 调用 程序 单元 
飞船 程序 的 多 个 激活 ， 每 个 激活 都 配 有 描述 不 
同 飞船 特征 的 参数 。 | A 
一 个 与 并 行 处 ;复杂 的 问题 就 是 Wi 
与 并 行 处 理 相关 的 更 复杂 的 问题 就 是 yyy 一 


两 个 处 理 线程 之 间 的 通信 。 例 如 ， 在 飞船 的 例 “元 请 求 函数 
子 中 ， 代 表 不 同 飞 船 的 线程 可 能 需要 相互 之 间 | 
通告 它们 的 方位 以 协调 行动 。 在 其 他 情况 中 ， 


一 个 线程 需要 等 待 ， 直 到 另 一 个 线程 到 达 了 它 | ” 
的 任务 之 前 需要 停止 另 一 个 线程 。 元 同时 执行 


长 期 以 来 ， 这 种 通信 需求 一 直 是 计算 机 科 Ra 
学 家 研究 的 课题 ， 并 且 许多 新 的 程序 设计 语言 0 
都 有 不 同 的 解决 线程 交互 问题 的 办 法 。 例 如 ， 考 虑 当 两 个 线程 操作 同一 个 数据 时 面临 的 通信 间 
题 。( 这 个 例子 在 选读 的 3.4 节 中 有 更 详细 的 描述 。) 如 果 并 发 执行 的 两 个 线程 都 需要 给 一 个 公用 
的 数据 项 值 加 3, 就 需要 一 个 方法 来 保证 在 允许 另 一 个 线程 执行 任务 之 前 先 允许 一 个 线程 完成 任 
务 , 否则 它们 会 使 用 相同 初始 值 开始 各 自 的 计算 , 这 将 意味 着 最 后 的 结果 将 会 是 加 3 而 不 是 加 6。 
一 次 只 能 由 一 个 线程 访问 的 数据 必须 互 斥 访问 。 

一 种 实现 互 斥 访问 的 方式 就 是 编写 描述 所 涉及 线程 的 程序 单元 ， 以 便 在 一 个 线程 正在 使 用 共 
享 数据 时 ， 它 可 以 阻止 其 他 线程 访问 这 个 数据 ， 直 到 这 样 的 访问 是 安全 的 。( 这 个 办 法 在 3.4 节 中 
描述 过 ， 在 那里 我 们 把 一 个 进程 中 访问 共享 数据 的 那 部 分 标识 为 临界 区 。) 经验 表明 ， 这 个 办 法 
是 有 缺陷 的 ， 它 把 保证 互 斥 的 任务 分 散在 程序 各 处 一 每 个 访问 该 数据 的 程序 单元 都 必须 是 正确 
设计 的 才能 确保 这 种 互 斥 ， 因 此 一 个 程序 段 中 的 错误 就 能 破坏 整个 系统 。 由 于 这 个 原因 ， 许 多 人 
认为 一 个 更 好 的 解决 办 法 是 使 数据 项 有 控制 对 自身 访问 的 能 力 。 简 而 言 之 ， 不 再 依赖 于 访问 数据 
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的 线程 来 防止 多 重 访问 , 而 是 赋予 数据 项 本 身 这 个 能 力 , 结果 是 访问 控制 集中 于 程序 中 的 一 个 点 ， 
而 不 是 分 散 于 许多 程序 单元 中 。 增 加 了 对 自身 访问 的 控制 能 力 的 数据 项 称 作 监控 程序 (monitor)。 










和 动 设备 和 恋 入 式 设备 开发 软件 通常 使用 在 和 他 环境 中 使 用 的 相同 的 
有 较 大 的 键盘 和 额外 的 耐心 ， 我 们 可 以 单 使 用 智能 手机 编写 菜 些 智 能 手机 
况 下 ， 智 能 手机 的 软件 都 是 使 用 特殊 软件 系统 在 台式 机 上 开发 的 ， 而 
用 于 编辑 、 翻 译 和 测试 智能 手机 软件 的 工具 ， 简 单 的 应 用 通常 用 
写 。 不过， 若 要 编写 较 复杂 的 应 用 或 核心 系统 软件 ， 我 们 可 能 雷 要 额外 支 


我 们 的 结论 是 ， 程 序 设计 语言 中 对 于 并 行 处 理 的 设计 包括 开发 表达 诸如 线程 的 创建 、 线 程 
的 暂停 和 重启 、 临 界 区 的 标识 以 及 监控 程序 的 组 成 等 的 办 法 。 

最 后 ， 我 们 应 当 注意 ， 尽 管 动画 提供 了 一 个 探索 并 行 计 算 问 题 的 有 趣 场 景 ， 但 是 这 仅仅 是 
从 并 行 处 理 技术 中 受益 的 许多 领域 中 的 一 个 。 天 和 气 预报 、 空 中 交通 管制 、 复 杂 系 统 〈 从 核反应 
到 行人 的 交通 ) 的 模拟 、 计 算 机 联网 以 及 数据 库 维 护 都 是 可 以 应 用 这 项 技术 的 领域 


问题 与 练习 


k 可 以 进行 并 发 处 理 的 程序 设计 语言 有 哪些 特性 是 较 传统 的 语言 中 没有 的 ? 
2. 描述 两 种 可 以 确保 对 数据 进行 互 斥 访问 的 方法 。 
3. 说 出 除了 动画 以 外 可 受益 于 并 行 计算 的 其 他 环境 。 


一 一 一 -一 一 > 一 一 一 一 一 一 一 -一 一 ”一 一 一 -一 一 一 一 -一 -一 一 -一 一 
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在 6.1 节 ， 我 们 断言 形式 逻辑 提供 了 一 个 通用 的 解决 问题 的 算法 ， 围 绕 这 个 算法 可 以 构建 一 
个 说 明 性 程序 设计 系统 。 在 本 节 中 ， 我 们 将 研究 这 个 断言 ， 首 先 介 绍 这 个 算法 的 基本 原理 ， 然 
后 再 简要 地 看 一 看 基于 这 种 算法 的 说 明 性 程序 设计 语言 。 


6.7.1 逻辑 推演 


假设 克 米 特 不 是 生病 就 是 在 舞台 上 ， 并 且 我 们 得 知 克 米 特 不 在 舞台 上 ， 所 以 我 们 推断 克 米 
特 一 定 是 病 了 。 这 个 演绎 推论 的 例子 称 为 消解 (resolution)。 消解 是 一 种 称 为 推理 法 则 (inference 
rule) 的 许多 技法 之 一 ， 可 以 用 来 从 大 量 的 陈述 中 推导 出 结果 。 

为 了 更 好 地 理解 消解 , 我 们 首先 可 以 用 单个 字母 来 表示 简单 语句 , 通过 符号 一 来 表示 语句 的 否定 。 
例如 ， 我 们 用 4 来 代表 “ 克 米 特 是 一 位 王子 ” 用 B 来 代表 “ 佩 吉 小 姐 是 一 位 演员 ”， 那么， 表达 式 

AORB 
的 意思 就 是 “ 克 米 特 是 一 位 王子 或 者 佩 吉 小 姐 是 一 位 演员 ”， 而 

BAND 一 4 
的 意思 就 是 “ 佩 吉 小 姐 是 一 位 演员 而 克 米 特 不 是 一 位 王子 ”。 我 们 将 用 箭头 来 表示 “蕴涵 ”关系 。 
例如 ， 表 达 式 

4 一 有 
的 意思 是 “如 果 克 米 特 是 一 位 王子 ， 佩 吉 小 姐 就 是 一 位 演员 ”。 
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以 这 种 通 式 ， 消 解 原理 意味 着 从 语句 

PORO 
和 

ROR 一 0 
可 以 归结 出 语句 

PORR 
这 样 ， 我 们 就 说 原来 的 两 个 语句 消解 形成 了 第 三 个 语句 ， 我 们 称 之 为 消解 式 〈resolvent)。 重 要 
的 是 要 看 到 ， 这 个 消解 式 是 原始 语句 的 逻辑 结论 。 这 就 是 说 ， 如 果 原 始 语 句 是 真 的， 那么 消解 
式 也 一 定 是 真 的 。( 如 果 QO 是 真 的 ， 那么 R 一 定 是 真 的 ， 如 果 QO 是 假 的 ， 那么 P 一 定 是 真 的 。 因 此 ， 
不 管 O 是 真是 假 ，P 或 者 R 一 定 是 真 的 。) 

如 图 6-24 所 示 ， 我 们 用 图 形 化 的 方法 表示 了 这 两 个 语句 的 消解 ， 在 这 个 图 中 ， 引 自 原始 语 
句 的 连 线 指向 下 面 的 消解 式 ,注意 , 消解 只 能 用 于 成 对 儿 语 句 , 并 且 这 些 语句 以 子 句 形式 (clause 
form)〉 出 现 ， 也 就 是 说 ， 语 句 的 基本 元 素 是 通过 布尔 运算 符 OR 连 接 起 来 的 。 因 此 

PORO 
是 子 名 形式， 而 

P=s0 
就 不 是 子 句 形式 。 这 对 于 我 们 来 说 不 是 很 重要 ， 因 为 这 是 数理 逻辑 中 的 一 个 定理 的 结论 ， 这 个 定 
理 说 ,任何 以 一 阶 谓词 逻辑 (一 个 用 扩展 的 表达 能 力 表示 语句 的 系统 ) 表达 的 语句 都 可 以 用 子 句 
形式 来 表达 。 我 们 不 在 这 里 进一步 探讨 这 个 重要 的 定理 ， 但 是 为 了 今后 的 使 用 ， 我 们 发 现 语 句 

p>»0 
等 价 于 子 句 形式 的 语句 

OOR 一 P 

如 果 一 组 语句 中 的 所 有 语句 不 可 能 同时 为 真 ， 那 么 这 组 语句 就 是 不 相 容 的 (inconsistent)。 
换 名 话说， 一 组 不 相 容 的 语句 是 一 组 自 相 矛盾 的 语句 。 一 个 简单 的 例子 是 语句 P 与 语句 一 P 的 组 
合 。 逻辑 学 家 已 经 证 明 , 重复 的 消解 提供 了 验证 一 个 不 相 容 子 句 集合 的 不 相 容 性 的 系统 化 方法 ， 
这 个 方法 的 规则 是 ， 如 果 反 复 进行 消解 而 产生 了 一 个 空子 句 〈 消 解 子 句 形 式 P 和 子 句 形式 一 P 的 
结果 )， 那 么 原来 的 那 组 语句 必定 是 不 相 容 的 。 例 如 ， 图 6-25 证 明 语 句 集合 

PORO 


ROR —0 
—R 
—P 
是 不 相 容 的 。 
PORO ROR—O —R =P 
PORR 天 
PORO ROR—0 ~ 上 
PORR 空子 句 
图 6-24 ”消解 语句 C(POR CO) 和 图 6-25 ”消解 语句 C(POR 0)、 


(ROR 一 O) 推出 CPORR) (ROR—O0)、 一 R 和 一 P 


222 第 6 章 程序 设计 语言 


假定 我 们 要 证 明 一 组 语句 蕴涵 了 语句 P。 推 导 这 个 语句 P 就 相当 于 对 语句 一 P 取 反 。 因 此 ， 
要 证 明 原 来 的 那 组 语句 蕴涵 P， 只 需 将 原来 的 语句 与 一 P 进 行 消解 ， 直 到 产生 一 个 空子 句 。 基 于 
获得 的 空子 句 , 我 们 就 可 以 说 一 P 与 原来 的 语句 组 是 不 相 容 的 ， 从 而 推导 出 原来 的 那 组 语句 一 定 
蕴涵 P。 
在 将 消解 应 用 于 一 个 实际 的 程序 设计 环境 之 前 ， 还 有 最 后 一 个 问题 。 假 设 我 们 有 两 个 语句 
(Mary is at X) ~ (Mary's lamb is at X) 
(其 中 x 代 表 任 何 地 方 》 和 
Mary is at home 
按照 子 名 形式， 这 两 个 语句 变 为 
(Mary’s lamb is at X) OR 一 (Mary is at X) 
和 


(Mary is at home) 
乍 一 看 ， 似 乎 没有 可 以 消解 的 元 素 。 另 一 方面 ， 元 素 (Mary is at home) 和 一 (Mary is at X) 
近 于 相互 对 立 。 问 题 是 要 认识 到 ，Mary is at X 是 一 个 关于 位 置 的 通用 语句 ， 而 关于 home 
的 语句 则 是 它 的 特殊 形式 。 因 此 ， 对 于 第 一 个 语句 的 特殊 情况 是 

(Mary's lamb is at home) OR 一 (Mary is at home) 
它 可 以 与 语句 

(Mary is at home) 
消解 产生 语句 

(Mary's lamb is at home) 


把 值 赋 给 变量 (如 将 值 home 赋 给 X)， 从 而 使 得 消解 可 以 进行 的 过 程 称 为 合 一 〈unification )。 这 
个 过 程 使 得 演绎 系统 中 的 通用 语句 可 以 用 于 特定 的 应 用 。 


0.7.27 "PIVIGg 


程序 设计 语言 Prolog (PROgramming in LOGic 的 简写 ) 是 一 个 说 明 性 程序 设计 语言 ， 它 解 
决 问题 的 基本 算法 就 是 反复 地 进行 消解 ， 这 样 的 语言 称 为 逻辑 程序 设计 (logic programming) 
语言 。 一 个 Prolog 程 序 由 一 组 初始 语句 组 成 ， 基 本 的 算法 在 这 组 语句 的 基础 上 进行 演绎 推理 。 
构成 这 些 语句 的 成 分 称 为 谓词 (predicate)。 一 个 谓词 由 一 个 标识 符 和 一 个 带 括号 的 语句 组 成 ， 
括号 里 列 有 该 谓词 的 变 元 。 一 个 谓词 代表 一 个 与 它 的 变 元 相关 的 事实 ， 因 而 谓词 标识 符 的 选取 
通常 都 反映 了 该 事实 的 基本 语义 。 因 此 ， 如 果 想 表达 Bil 是 Mary 的 家 长 的 这 一 事实 ， 我 们 可 以 
使 用 谓词 形式 

parent (bill, mary) 

注意 ， 尽 管 这 个 谓词 里 的 变 元 表示 的 是 专 有 名 词 ， 但 是 它们 仍然 是 以 小 写字 母 开 始 的 ， 这 
是 因为 Prolog 区 分 常量 变 元 和 变量 变 元 的 依据 是 常量 以 小 写字 母 开 始 ， 而 变量 以 大 写字 母 开始 。 
[这 里 , 我 们 使 用 了 Prolog 的 术语 , 用 术语 常量 代替 更 通用 的 术语 字面 量 。 更 准确 一 点 讲 ,在 Prolog 
里 用 词语 bpil1 (注意 是 小 写 ) 表示 的 字面 量 可 能 会 被 更 通用 的 表示 法 表示 为 “Bil1”， 而 词语 
Bil1《〈 注 意 B 是 大 写 ) 在 Prolog 中 表示 变量 。] 

Prolog 程 序 中 的 语句 有 事实 和 规则 两 种 ， 每 一 种 都 是 以 一 个 句点 来 结束 的 。 一 个 事实 包括 
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一 个 谓词 。 例 如 ， 乌 龟 比 蜗牛 快 这 个 事实 用 Prolog 语 句 可 以 这 样 来 表示 ; 
faster (turtle, snail). 
而 兔子 比 乌龟 快 的 事实 可 以 这 样 来 表示 : 

faster (rabbit, turtle). 

一 个 Prolog 规 则 就 是 一 个 “蕴涵 ”语句 。 但 是 ，Prolog 程 序 员 并 不 是 将 语句 写成 XY 一 了 这 种 
形式 ， 而 是 写成 “YifX” 这 样 ， 只 是 单词 f 用 符号 :- (一 个 冒号 和 一 个 连 字 符 ) 代替 了 。 因 此 
规则 “Xis old implies Xis wise” 对 于 一 个 逻辑 学 家 来 说 可 能 要 这 样 来 表述 : 

ola(X) — wise (X) 


而 在 Prolog 语 言 里 则 表示 为 : 


wise(X) :一 old(X)., 
又 如 ， 规 则 

(faster (X, Y) AND faster(Y，2)) 一 faster(X, 2) 
在 Prolog 里 表达 为 : 

faster (XK 2}) — fasteriX, Yy: faster(Y;: 2 


[这 个 分 隔 faster (Xx，Y) 和 faster (Y，2) 的 去 号 代表 合 取 符 AND。] 尽管 这 样 的 规则 不 是 子 
名 形式 ， 但 是 它们 在 Prolog 里 是 被 允许 的 ， 因 为 它们 很 容易 转化 为 子 句 形式。 

记 住 ，Prolog 系 统 并 不 知道 程序 中 谓词 的 意义 ， 它 只 是 根据 消解 推理 规则 以 完全 的 符号 方 
式 来 对 语句 进行 操作 。 因 此 ， 用 事实 和 规则 来 描述 谓词 的 有 关 特 性 完全 是 程序 员 的 职责 。 从 这 
一 点 来 看 ，Prolog 的 事实 倾向 于 用 来 标识 谓词 的 特殊 实例 ， 而 规则 用 来 描述 一 般 的 原理 。 这 就 
是 前 面 有 关 谓 词 fastezr 的 语句 所 使 用 的 方法 。 这 两 个 事实 描述 了 “ 快 ” 的 特定 实例 ， 而 规则 描 
述 了 一 个 一 般 的 属性 。 注意， 兔子 比 蜗牛 快 的 事实 ， 尽 管 没 有 明说 ， 但 这 是 两 个 事实 通过 规则 
结合 的 结论 。 

当 使 用 Prolog 语 言 进行 软件 开发 时 ， 程 序 员 的 任务 就 是 开发 一 组 事实 和 规则 来 描述 已 知 的 
信息 。 这 些 事实 和 规则 构成 了 要 在 演绎 系统 中 使 用 的 初始 语句 集合 。 一 旦 这 个 语句 集合 确定 了 ， 
就 可 以 向 系统 提出 一 些 猜 测 〈 在 Prolog 术 语 中 称 为 目标 ) 通常 是 用 计算 机 的 键盘 键入 它们 。 
当 向 Prolog 系 统 提 交 这 样 的 一 个 目标 后 ， 系 统 利用 消解 来 试图 证 明 这 个 目标 是 初始 语句 的 结论 。 
基于 我 们 描述 更 快 关 系 的 那 组 语句 ， 可 以 证 明 下 面 的 每 一 个 目标 

faster (ErtlLeyr SnaiJ) ， 

faster (rabbit, turtle). 

faster (rabbit, snail). 
因为 每 一 个 都 是 初始 语句 的 逻辑 结论 。 最 开始 的 两 个 与 出 现在 初始 语句 中 的 事实 相同 ， 而 第 三 
个 需要 系统 的 某 种 程度 上 的 演绎 。 

如 果 我 们 提供 的 目标 的 变 元 不 是 常量 而 是 变量 ， 那 么 可 以 得 到 更 为 有 趣 的 例子 。 在 这 种 情 
况 下 ，Prolog 试 图 从 初始 语句 中 推导 出 目标 ， 同 时 跟踪 推导 所 需要 的 合 一 。 然 后 ， 如 果 这 个 目 
标 达到 了 ，Prolog 就 报告 这 些 合 一 。 例 如 ， 考 虑 目标 

faster (W, snail). 

Prolog 对 于 它 的 响应 是 报告 


faster(turtle, snail). 
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的 确 ， 这 是 初始 语句 的 一 个 结论 ， 并 且 通 过 合 一 与 这 个 目标 一 致 。 此 外 ， 如 果 要 求 Prolog 提 供 
更 多 的 结论 ， 那 么 它 会 找到 并 报告 结论 


faster (rabbit, snail). 

而 我 们 能 通过 提出 目标 
faster (rabbit, W). 

来 要 求 Prolog 寻 找 一 些 比 兔子 慢 的 动物 的 实例 。 事 实 上 ， 如 果 我 们 以 目标 
faster (V, W). 


开始 ，Prolog 将 会 报告 所 有 可 以 从 初始 语句 中 推导 出 来 的 更 快 关系 。 这 意味 着 一 个 简单 的 Prolog 
程序 可 以 用 来 证 明 某 种 特定 的 动物 比 另 一 种 快 ， 找 出 那些 比 某 种 给 定 的 动物 快 的 动物 ， 找 出 那 
些 比 某 种 给 定 的 动物 慢 的 动物 ， 或 者 找 出 所 有 的 更 快 关系 。 

这 个 潜在 的 多 功能 性 是 激发 计算 机 科学 家 们 想象 的 特性 之 一 。 遗 憾 的 是 ， 当 在 Prolog 系 统 中 
实现 时 ， 消 解 过 程 显示 了 它 理 论 形式 中 并 没有 呈现 出 来 的 限制 ， 因 此 Prolog 程 序 可 能 会 辜负 它们 
被 预期 的 灵活 性 。 为 便于 理解 ， 首 先 注 意图 6-25 中 的 示意 图 ， 它 只 显示 了 与 手头 任务 相关 的 那些 
消解 ， 此 外 ， 还 有 一 些 其 他 的 消解 方式 , 例如， 最 左 子 句 和 最 右 子 句 的 消解 可 产生 消解 式 Q。 这 样 ， 
除了 描述 应 用 所 涉及 的 事实 和 规则 的 语句 外 ，Prolog 程 序 经 常 必须 包含 一 些 额外 的 能 正确 指导 消解 
过 程 的 语句 。 由 于 这 个 原因 ， 实 际 的 Prolog 程 序 可 能 不 能 获得 我 们 先前 例子 表明 的 目的 多 样 性 。 


问题 与 练习 
1. 语句 R、 本 T、0 和 V 中 哪 一 个 是 (一 R OR TOR Ss) (SOR 内 (VOR R).(UOR 一 9) (TOR U)FI(S OR VV) 
构成 的 集合 的 逻辑 结论 ? 
. 下 面 这 组 语句 是 相 容 的 吗 ? 请 解释 你 的 答案 。 
POR O ORR —R ORO ROR=P 一 O 
- 完成 下 面 的 Prolog 程 序 末 尾 的 两 个 规则 ， 以 使 得 谓词 mother(X，Y) 的 含义 是 “X 是 Y 的 母亲 ”， 
fathez (X Y) 的 含义 是 “X 是 Y 的 父亲 ”。 
female (carol). 
female (sue) . 
male (bill). 
male (john). 
Parent (john, carol). 
Parent (sue, carol). 
mother (X, Y):- 
father(X; YY):= 


. 根据 问题 3 中 的 Prolog 程 序 ， 下 面 的 规则 想 要 表述 这 样 的 含义 ， 如 果 x 和 Y 有 共同 的 父母, x 是 Y 的 同胞 。 
sibling(X, Y) :- parent(2, X), parent (2, Y). 


这 个 同胞 关系 的 定义 会 使 Prolog 得 出 什么 意外 的 结论 ? 


MD 


be 





复习 题 
( 带 * 的 题目 涉及 选读 章节 的 内 容 。) 2. 将 下 面 的 Python 程序 翻译 成 附录 C 中 描述 的 机 
1. 说 一 种 程序 设计 语言 是 机 器 无 关 的 , 这 是 什 器 语言 


么 意思 ? 喜 去 个 


by 


ua 


while (x < 3): 


驴 过 区 本 灿 


. 将 语句 


Halfway = Length + Width 
翻译 成 附录 C 中 描述 的 机 器 语言 ， 假 设 Length、 
Width 和 Halfway 都 以 浮 点 记 数 法 表示 。 
将 高 级 语言 语句 
if (X == 0) : 

ZZ=Y+W 
else: 

Z=Y+X 
翻译 成 附录 C 中 描述 的 机 器 语言 ， 假 设 W、X、 
Y 和 z 的 值 都 是 用 二 进 制 补 码 记 数 法 表示 的 ， 
每 个 值 使 用 存储 器 中 的 一 个 字 节 。 


. 在 第 4 题 中 ， 为 了 翻译 这 些 语句 ， 为 什么 标识 


变量 的 数据 类 型 是 必要 的 ? 为 什么 许多 高 级 
程序 设计 语言 需要 程序 员 在 程序 的 开头 标识 
每 一 个 变量 的 类 型 ? 


6. 说 出 并 描述 4 种 不 同 的 程序 设计 范 型 。 


Ea 


© 


假设 函数 需要 两 个 数值 作为 它 的 输入 ,并 且 
返回 这 两 个 值 中 较 小 的 一 个 作为 输出 值 。 如 果 
w、x、y 和 lz 都 代表 数值 ， 那 么 f (f (w, x), 了 0, z)) 
的 返回 结果 是 什么 ? 


. 假设 是 一 个 函数 ， 它 返回 一 个 输入 符号 串 经 


过 反 转 得 到 的 结果 ; 8 是 一 个 函数 ， 它 返回 两 
个 输入 符号 串 经 过 连接 得 到 的 结果 。 如 果 x 是 
串 abcdq， 那 么 g(f (x),*) 的 返回 值 是 什么 ? 


. 假设 你 要 写 一 个 面向 对 象 程序 来 维护 自己 的 


财务 记录 。 在 表示 活期 账户 的 对 象 里 应 该 存放 
什么 数据 ? 这 个 对 象 会 响应 什么 样 的 消息 ? 
程序 中 可 能 使 用 的 其 他 对 象 是 什么 ? 


. 概述 机 器 语言 和 汇编 语言 的 区 别 。 
. 为 附录 C 中 描述 的 机 器 语言 设计 一 个 汇编 


语言 s 


. 程序 员 John 认 为 在 程序 中 声明 一 个 常量 的 功 


能 是 不 必要 的 ， 因 为 可 以 用 一 个 变量 来 代替 
它 。 例 如 ,在 6.2 节 中 的 AirportAlt 的 例子 中 ， 
可 以 把 AirportAlt 声 明 为 一 个 变量 , 然后 在 
程序 的 开头 为 其 赋 需 要 的 值 .为 什么 这 种 方法 
不 如 使 用 常量 好 ? 


. 概述 声明 语句 和 命令 语句 之 间 的 区 别 。 
. 解释 字面 量 、 常 量 和 变量 之 间 的 区 别 。 
. a. 什么 是 运算 符 优先 级 ? 


b. 根据 运算 符 优先 级 ， 表 达 式 6+2X3 的 值 是 


2 


2 


jk 


22. 


23. 


S 
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什么 ? 
什么 是 结构 化 程序 设计 ? 


. 语句 


if (X == 5) : 


中 的 双 “ 等 ”号 和 赋值 语句 
站 到 普 , 志 芝 


中 的 单 “ 等 ”号 的 区 别 是 什么 ? 


. 画 一 个 流程 图 来 表示 下 面 的 for 语 句 所 表达 


的 结构 。 
for(int Xx = 2} 


dd 


让 


. 用 Python 的 while 语 句 把 下 列 的 for 语 句 翻译 


成 等 效 的 程序 段 。 
ortant KR 
ar 

如 果 你 熟悉 乐谱 , 就 像 对 待 程序 设计 语言 那样 
分 析 音 乐 符号 。 什 么 是 控制 结构 ? 什么 是 插入 
程序 注释 的 语法 ? 什么 音乐 符号 有 类 似 于 图 6-7 
中 的 foz 语 句 的 语义 ? 

画 一 个 流程 图 来 表示 下 面 的 语句 所 表达 的 结构 。 


Switch (suit) 


++X) 


{ease "clubs': bid(1);» 
case '"'diamonds': bid(2); 
case 'hearts': bid(3); 
case 'spades': bid(4); 


} 


重 写 下 面 的 程序 段 ， 使 用 一 个 case 语 句 代 替 
幅 套 的 if-else 语 句 。 


if (W == 5): 
ZzZ=7 
else: 
dE WN ==; 6) 8 
0 
else: 
if (W == 7): 
X=7 


使 用 一 个 if-else 语 句 ， 概 括 下 面 的 例 程 : 


4 ES 5 then goto 30 
区 竺 入 过 二 
goto 90 

80 X=X+2 

90 stop 
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25;, 
26. 


27, 
28. 


2 


30. 


al 
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概述 在 命令 式 语言 和 面向 对 象 语言 中 找到 的 
用 于 实现 下 述 每 个 活动 的 基本 控制 结构 。 

a. 判断 接 下 来 应 该 执行 哪 一 条 命令 。 

b. 重复 一 组 命令 。 

c. 改变 变量 的 值 。 

概述 翻译 器 和 解释 器 的 区 别 。 

假设 程序 中 的 变量 x 声明 为 整 型 。 当 执行 语句 


六 吉 3 


时 ， 会 发 生 什么 错误 ? 
说 一 个 程序 设计 语言 是 强 类 型 的 意思 是 什么 ? 
为 什么 一 个 大 的 数组 不 太 可 能 通过 按 值 传递 
的 方式 传递 给 函数 ? 
假设 Python 函数 Modify 的 定义 为 
def Modify (Y) : 

Y=7 

print (Y) 
如 果 参 数 是 按 值 传递 的 , 那么 在 执行 下 面 这 个 
程序 段 时 , 会 打印 出 什么 结果 ? 如 果 参 数 是 按 
引用 传递 的 呢 ? 
X = 5 
Modify (X) 
print (X) 
假设 Python 函数 Modify 的 定义 为 
def Modify (Y) : 

区 区 

print (X) 

print (Y) 
其 中 x 是 全 局 变量 。 如 果 参 数 按 值 传递 ， 那 么 
执行 下 面 的 程序 段 会 打印 出 什么 结果 ? 如 果 
参数 是 按 引 用 传递 的 呢 ? 

X=5 

Modify (XxX) 

print (X) 
有 时 , 实 参 是 通过 产生 一 个 函数 要 使 用 的 副本 
来 传递 给 函数 的 (如 按 值 传 递 时 ), 但 在 函数 完 
成 时 ， 函 数 副 本 里 的 值 会 在 调用 函数 继续 执行 
之 前 传送 给 实 参 。 在 这 种 情况 下 ， 称 参数 是 按 
“ 值 -结果 ”传递 的 。 如 果 参 数 按 值 -结果 传递， 
那么 第 30 题 的 程序 段 会 打印 出 什么 结果 ? 
a. 按 值 传递 参数 相对 于 按 引 用 传递 参数 有 哪 
些 优点 ? 
b. 按 引用 传递 参数 相对 于 按 值 传递 参数 有 哪 
些 优点 ? 
下 面 的 语句 存在 什么 歧义 ? 


34. 


35: 


36. 


37. 


38. 
39. 


40. 


41. 


42. 


xX = 
假设 一 个 小 公司 有 5 名 雇员 , 并且 计划 增加 到 6 
名 .而 且 假设 下 面 的 赋值 语句 是 该 公司 的 一 个 
程序 中 的 语句 ， 


DailySalary= TotalSal/5; 


让 市 县 芝 与 


AvgSalary = TotalSal/5; 
DailySales = TotalSales/5; 
AvgSales = TotalSales/5; 


那么 ， 如 果 该 程序 使 用 了 常量 NumberOfEmp 
和 WorkWeek〔 值 都 为 53)， 那 么 如 何 简化 更 新 
程序 的 任务 才能 把 赋值 语句 表达 为 : 


DailySalary = TotalSal/DaysWk; 
AvgSalary = TotalSal/NumEmpl; 
DailySales = TotalSales/DaysWk; 
AvgSales = TotalSales/NumEmpl; 


a. 形式 语言 和 自然 语言 之 间 的 区 别 是 什么 ? 
b. 分 别 举 一 个 例子 。 

用 语法 图 来 表示 第 5 章 的 Python while 语 句 的 
结构 。 

设计 一 套用 来 描述 你 本 地 电话 号 码 的 语法 的 
语法 图 。 例 如 ， 在 美国 ， 电 话 号 码 由 一 个 分 
区 电话 号 码 、 一 个 地 区 电话 号 码 和 一 个 4 位 数 
字 组 成 ， 如 (444) 555-1234。 

设计 一 套用 来 描述 你 母语 里 简单 句 的 语法 图 。 
设计 一 套用 来 描述 不 同 的 日 期 表示 方式 的 语 
法 图 ， 如 月 /日 /年 或 是 月 日 , 年 
设计 一 套用 来 描述 “句子 ”的 文法 结构 的 语 
法 图 ， 其 中 “句子 ”要 由 单词 yes 后 跟 相同 数 
量 的 单词 no 组 成 。 例 如 ， 句 子 “yes yes no no” 
符合 要 求 ， 而 句子 “no yes”“yes no no” 和 
“yes no yes” 就 不 符合 要 求 。 

有 一 种 “句子 ”是 这 样 的 ; 单词 yes 的 后 面 
跟 有 相同 数量 的 单词 no, 其 后 又 跟 有 相同 数 
量 的 单词 maybe, 例如 ,“yes no maybe”“yes 
yes no no maybe maybe” 就 是 这 样 的 句子 ， 
而 “yes maybe” “yes no no maybe maybe” 
“maybe no” 就 不 是 。 给 出 一 个 论据 说 明 ， 
无 法 设计 出 能 一 套 描述 这 种 句子 的 文法 结 
构 的 语法 图 。 

写 一 个 句子 描述 下 面 语法 图 定义 的 字符 串 的 结 
构 ， 然 后 画 出 字符 串 xxxyxx 的 语法 分 析 树 。 


字符 审 
Ge 
Cy 


43. 


44. 


45. 


46. 


47. 


48. 


49. 


50. 
. a. 给 出 一 个 实例 变量 应 该 是 私有 的 例子 。 


51 


为 6.4 节 中 的 问题 5 增加 语法 图 , 以 得 到 一 个 定 
义 Dance 结 构 为 Chacha 或 者 为 Waltz 的 一 套 语 
法 图 ， 其 中 Waltz 包 括 一 个 或 多 个 以 下 模式 的 
副本 : 

forward diagonal close 

或 
backward diagonal close 

基于 图 6-15 中 的 语法 图 ， 为 表达 式 xXy 十 y 坟 x 
画 出 语法 分 析 树 。 

当 为 下 面 的 语句 生成 机 器 代码 时 , 代码 生成 器 
可 以 实现 哪些 代码 优化 ? 


if (X == 5) : 


Z=X+2 
else: 

2 =X+4 
简化 下 面 的 程序 段 : 
YY 二 达 
if (Y == 7): 

Z=8 
else: 

ZZ= 9 


简化 下 面 的 程序 段 ; 
while (X != 5): 
X= 5 
在 面向 对 象 程序 设计 环境 中 , 类 型 和 类 有 哪些 
相似 ， 又 有 哪些 不 同 ? 
描述 不 同类 型 建筑 的 类 的 开发 可 能 会 如 何 使 
用 继承 。 
在 类 中 私有 部 分 与 公有 部 分 的 区 别 是 什么 ? 


b. 给 出 一 个 实例 变量 应 该 是 公有 的 例子 。 
c. 给 出 一 个 方法 应 该 是 私有 的 例子 。 
d. 给 出 一 个 方法 应 该 是 公有 的 例子 。 


社会 问题 


52. 


I 


*54. 


%55: 


*S6, 


57 


*58. 


*59; 
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说 明 在 模拟 酒店 大 厅 里 行人 交通 时 可 能 需要 
的 一 些 对 象 以 及 某 些 对 象 需要 实现 的 动作 。 
在 程序 设计 语言 环境 中 ， 术 语 监控 程序 指 
什么 ? 

并 发 处 理 的 什么 属性 使 它 需 要 使 用 文 持 并 发 
的 程序 设计 语言 ? 

画 一 个 表示 消解 的 图 (类 似 于 图 6-25)， 来 说 
明 语句 (OOR 一 R) 、(TORR) 、 一 P、(POR 
一 7) 和 (P OR 一 0) 的 集合 是 不 相 容 的 。 
语句 一 R、(TOR R) 、(P OR 一 0)、(Q0 OR 
一 7) 和 (R OR 一 P) 的 集合 是 相 容 的 吗 ? 请 解 
释 你 的 答案 。 

扩展 6.7 节 中 问题 3 和 和 问题 4 描述 的 Prolog 程 序 ， 
包含 另外 的 家 庭 关 系 : 叔叔 ( 舅 田 入 姑姑 ( 姨 )、 
祖父 母 和 堂 兄弟 姐妹 。 还 要 增加 定义 Parents 
(X，Y，2) 的 规则 表示 X 和 Y 是 2 的 父母 。 
假设 下 列 Prolog 程 序 的 第 一 条 语句 意味 着 
“Alice 喜 欢 运动 "翻译 程序 中 的 最 后 两 个 语 
句 。 然 后 ， 基 于 这 个 程序 ， 列 出 Prolog 将 能 
得 出 的 Alice 喜 欢 的 所 有 事情 。 请 解释 你 的 
列表 。 


1Likes(alice，sSports) .。 


likes (alice, music). 
music). 
likes (david, X) 


likes (alice, X) 


如 果 下 面 的 程序 段 在 一 台 用 1.7 节 中 描述 的 8 
位 浮 点 格式 表示 数值 的 机 器 上 执行 ,会 遇 到 什 
么 问题 ? 
X= 0.01 
while (xX != 1.00): 

Erint (KX) 

X=X+0.01 


likes (carol, 
:一 1ikes(X, sports)., 
:—- likes (david, X). 





Me 





希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 道德 、 社 会 和 法 律 问题 。 回 答 出 这 

些 问 题 还 不 够 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

1. 通常 ， 版 权 法 支持 与 一 个 想法 的 表达 有 关 的 所 有 权 ， 而 不 是 这 个 想法 本 身 。 因 此 ， 一 本 
书 中 的 段落 是 受 版 权 法 保护 的 ， 但 是 这 一 段落 表述 的 思想 就 不 受 保护 。 这 种 权利 如 何 扩 
展 到 源 程序 和 它们 表达 的 算法 呢 ? 一 个 了 解 某 商 业 软 件 包 中 所 使 用 的 算法 的 人 ， 应 当 在 
多 大 程度 上 被 允许 编写 表达 这 些 相同 算法 的 程序 ， 并 将 这 个 软件 推 向 市 场 ? 

2. 通过 使 用 高 级 程序 设计 语言 , 程序 员 可 以 使 用 诸如 if、 else 和 while 这 样 的 单词 来 表达 算法 。 
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计算 机 理解 这 些 词 的 含义 到 了 什么 程度 ? 正确 响应 这 些 词 的 使 用 的 能 力 是 否 意 味 着 对 词 
语 的 理解 ? 你 怎么 知道 另 一 个 人 理解 了 你 所 说 的 ? 

3. 一 个 开发 新 的 有 用 的 程序 设计 语言 的 人 应 当 有 从 这 个 语言 的 使 用 中 获 利 的 权利 吗 ? 如 果 
有 ， 如 何 保护 这 样 的 权利 ? 一 种 程序 设计 语言 可 以 在 多 大 程度 上 被 拥有 ? 公司 对 雇员 创 
新 的 智力 成 果 有 多 大 程度 上 的 所 有 权 ? 

4. 在 临近 最 后 期 限时 ， 一 个 程序 员 打 算 放弃 用 注释 语句 编制 文档 以 使 程序 能 够 按时 完成 ， 
这 可 以 被 接受 吗 ? 《初学 者 在 得 知 文档 对 于 专业 的 软件 开发 人 员 是 何等 重要 时 ， 往 往 非 
常 惊讶 。) 

5. 许多 程序 设计 语言 的 研究 致力 于 开发 出 一 种 能 让 程序 员 编写 出 人 类 易 读 且 懂 的 程序 的 语 
言 。 在 多 大 程度 上 应 当 要 求 程序 员 使 用 这 些 能 力 ? 也 就 是 说 ， 对 于 能 够 正确 实现 功能 但 
从 人 的 角度 看 来 写 得 不 好 的 程序 ， 在 什么 程度 上 才 算 是 好 程序 ? 

6. 假设 一 个 业余 程序 员 写 了 一 个 程序 供 自己 使 用 ， 但 程序 的 构造 比较 草率 。 这 个 程序 没有 
使 用 程序 设计 语言 的 易 读 特性 ， 效 率 不 高 ， 并 且 包 含 了 利用 特殊 情况 (这 个 程序 员 试 图 
使 用 这 个 程序 的 特殊 环境 ) 的 省 事 方法 。 此 后 ， 这 个 程序 员 把 他 的 程序 复制 给 希望 使 用 
这 个 程序 的 朋友 ， 而 他 的 朋友 又 把 这 个 程序 复制 给 了 他 们 的 朋友 。 这 个 程序 员 要 为 他 的 
程序 可 能 出 现 的 问题 负 多 大 责任 ? 

7. 计算 机 专业 人 员 对 于 各 种 程序 设计 范 型 应 该 精通 到 什么 程度 ? 某 些 公司 坚持 在 公司 的 所 
有 软件 开发 中 都 使 用 同一 种 预先 确定 好 的 程序 设计 语言 。 如 果 某 计算 机 专业 人 员 在 这 种 
公司 工作 ， 你 对 前 面 问题 的 回答 是 否 会 发 生变 化 ? 
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软件 工程 


2 全 的 是 在 下 放大 浊 的 各 向 生体 其 二 过 各 由 明科 的 同 是 > 丈 这 二 主 生 二 交付 
软件 工程 ， 是 因为 软件 开发 是 一 个 工程 化 的 过 程 。 研 究 软件 工程 的 目标 就 是 要 找到 
一 些 原则 来 指导 软件 开发 过 程 ， 进 而 生产 出 高 效 可 靠 的 软件 产品 。 


本 章 内 容 

7.1 软件 工程 学 科 7.6 质量 保证 

7.2 软件 生命 周期 7.7 文档 

7.3 ”软件 工程 方法 学 7.8 ”人 机 界面 

7.4 模块 化 7.9 软件 所 有 权 和 责任 
ys i BE 


软件 工程 是 计算 机 学 科 中 的 一 个 分 支 ， 致 力 于 寻找 指导 大 型 复杂 软件 系统 的 开发 原则 。 开 
发 这 类 系统 所 面 对 的 问题 并 非 只 是 编写 小 程序 所 面 对 问题 的 放大 。 比 如 说 ， 开 发 大 型 系统 的 时 
候 ， 要 求 许多 人 工作 很 长 时 间 ， 而 在 这 期 间 ， 预 期 的 系统 需求 可 能 会 改变 ， 参 与 该 项 目的 人 员 
也 可 能 会 变动 。 因 此 ， 软 件 工 程 包括 了 诸如 人 员 管 理 和 项 目 管理 之 类 的 主题 ， 与 计算 机 科学 相 
比 ， 这 样 的 主题 与 业务 管理 的 关系 更 密切 。 当 然 ， 我 们 的 侧重 点 还 是 放 在 那些 与 计算 机 科学 密 
切 相 关 的 主题 上 。 


7.1 ”软件 工程 学 科 


为 了 有 助 于 理解 软件 工程 中 涉及 的 问题 ， 这 里 可 以 想象 构造 一 个 大 型 的 复杂 设施 (一 辆 汽 
车 、 一 幢 多 层 办 公 大 楼 或 者 一 座 教 堂 )， 对 其 进行 设计 ， 然 后 监管 其 构建 过 程 。 如 何 估算 完成 该 
项 目 所 需 的 时 间 、 费 用 以 及 其 他 资源 ? 如 何 把 项 目 分 割 成 几 个 便于 管理 的 模块 ?如 何 保证 构建 
的 模块 相互 协调 一 致 ? 如 何 使 工作 在 不 同 模块 的 人 员 相 互 沟通 ? 如 何 衡 量 进度 ?如 何 妥 善 处 理 
更 广泛 的 细节 问题 〈 如 门 把 手 的 选择 、 滴 水 兽 的 设计 、 彩 色 玻 璃 窗 的 蓝 色 玻璃 的 需求 量 、 柱 子 
的 强度 、 供 暖 系 统 的 管道 设计 ) ? 在 一 个 大 型 软件 系统 的 开发 过 程 中 ， 同 样 需要 面 对 如 此 繁多 
的 问题 。 

有 人 也 许 会 这 样 认为 ， 工 程 是 一 个 很 成 熟 的 领域 ， 因 此 一 定 会 有 大 量 现成 的 可 以 用 来 解决 
软件 工程 中 的 这 些 问题 的 工程 技术 。 这 种 推理 有 一 定 的 道理 ， 但 是 忽略 了 软件 的 特性 与 其 他 工 
蛙 领域 特性 之 间 存 在 着 的 本 质 上 的 不 同 。 这 些 差 别 已 经 向 软件 工程 项 目 提出 了 挑战 ， 导 致 了 成 
本 超支 、 推 迟 交 付 软件 产品 和 软件 产品 不 能 满足 用 户 的 需求 等 后 果 。 所 以 ， 在 发 展 软件 工程 学 
科 上 ， 首 先 要 做 的 就 是 弄 清 这 些 差别 。 

差别 之 一 涉及 通过 通用 预制 构件 来 构建 系统 的 能 力 。 一 些 传统 的 工程 领域 已 经 长 期 受益 于 
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这 种 能 力 ， 即 在 构建 复杂 的 设备 时 ， 采 用 各 种 “现成 的 ”构件 。 例 如 ， 设 计 一 辆 新 车 时 ， 不 必 
设计 新 的 引擎 和 变速 器 ， 利 用 这 些 部 件 以 前 的 设计 方案 即 可 。 然 而 ， 软 件 工程 在 这 一 点 上 却 是 
很 落后 的 。 过 去 ， 以 前 设计 的 软件 构件 一 般 用 于 特定 的 领域 ， 即 这 些 构件 本 质 上 是 为 专门 的 应 
用 设计 的 ， 所 以 将 它们 作为 通用 构件 来 使 用 是 受 限 的 。 因 此 ， 复 杂 的 软件 系统 历来 都 是 从 头 做 
起 。 正 如 在 这 一 章 中 我 们 将 看 到 的 那样 ， 在 这 一 点 上 已 经 取得 了 重要 的 进展 ， 尽 管 还 有 很 多 工 
作 要 做 。 

软件 工程 学 科 与 其 他 工程 学 科 之 间 的 另 一 个 差别 在 于 缺少 , 用 来 衡量 软件 属性 的 定量 技术 
度量 学 (metrics)。 例 如 ,为 了 计算 开发 一 个 软件 系统 的 费用 ， 人 们 希望 能 够 估算 出 预期 产品 的 
复杂 性 ， 但 是 测量 软件 “复杂 性 ”的 方法 还 不 太 成 熟 。 同 样 ， 评 价 软件 产品 质量 的 方法 现在 也 
不 太 成 熟 。 对 于 机 器 设备 ， 质 量 的 重要 量度 是 平均 无 故障 时 间 ， 这 是 对 设备 耐 损耗 性 的 一 个 基 
本 衡量 指标 。 而 软件 与 此 相反 ， 它 没有 损耗 ， 所 以 这 种 方法 在 软件 工程 中 并 不 适用 。 

软件 属性 不 能 以 定量 的 方式 测量 ， 这 也 是 软件 工程 和 机 械 、 电 子 工程 不 同 ， 至 今 还 未 找到 
一 个 严格 、 坚 实 的 立足 点 的 主要 原因 。 机 械 和 电子 工程 是 建立 在 成 熟 的 物理 科学 的 基础 上 的 ， 
而 软件 工程 仍然 在 找寻 其 自身 的 根基 。 

因而 ， 现 在 的 软件 工程 研究 在 两 个 层面 上 进行 : 一 部 分 研究 者 (有 时 也 称 为 实践 派 ) 的 工 
作 指 向 开发 直接 应 用 的 技术 ; 另 一 部 分 研究 者 ( 称 为 理论 派 ) 则 致力 于 探寻 软件 工程 的 基础 原 
理 和 理论 ， 为 将 来 构建 更 坚实 的 技术 而 努力 。 基 于 自身 的 原因 ， 实 践 派 以 前 开发 和 提出 的 许多 
方法 已 经 被 其 他 方法 代替 ， 新 的 方法 可 能 也 将 随 着 时 间 的 推移 而 淘汰 。 与 此 同时 ， 理 论 派 的 进 
展 也 是 一 直 很 缓慢 。 

对 实践 派 和 理论 派 这 两 方面 进展 的 需求 是 巨大 的 。 我 们 这 个 社会 已 经 沉迷 于 计算 机 系统 及 
其 相关 的 软件 ， 我 们 的 经 济 、 保 健 、 政 府 、 法 律 实施 、 交 通 运 输 以 及 国防 系统 等 都 依赖 于 大 型 
的 软件 系统 。 然 而 ， 在 这 些 系 统 中 ， 可 靠 性 依然 是 最 主要 的 问题 。 软 件 错误 已 经 导致 了 一 些 大 
的 灾难 ， 新 近 的 灾难 如 月 亮 的 升 起 被 误 以 为 是 核 攻击 、 纽 约 银行 造成 的 一 天 损失 500 万 美元 、 空 
间 探 测 器 的 失踪 、 过 量 辐射 导致 的 人 员 伤 疡 ， 还 有 电话 通信 在 同一 时 间 大 面积 瘫痪 等 。 

这 并 不 是 说 情况 都 很 悲观 。 我 们 已 经 在 解决 诸如 缺少 预制 构件 和 衡量 标准 等 问题 方面 取得 
很 多 进展 。 此 外 ， 由 于 计算 机 技术 在 软件 开发 过 程 中 的 应 用 ， 导 致 了 称 为 计算 机 辅助 软件 工程 
(Computer-Aided Software Engineering，CASE) 的 出 现 ， 这 使 软件 开发 流程 化 ， 简 化 了 软件 的 
开发 过 程 。CASE 已 经 促进 了 各 种 称 为 CASE 工 具 (CASE tool) 的 计算 机 化 系统 的 发 展 ， 这 些 
系统 包括 项 目 设 计 系统 〈 用 来 辅助 成 本 估算 、 项 目 调 度 以 及 人 员 分 配 等 )、 项 目 管理 系统 〈 用 来 
辅助 监控 项 目的 开发 进度 )、 文 档 工 具 〈 用 来 辅助 编写 和 组 织 文档 )、 原 型 与 仿真 系统 〈 用 来 畏 
助 开 发 原型 系统 )、 界 面 设计 系统 〈 用 来 辅助 图 形 用 户 界面 的 开发 )、 程 序 设计 系统 〈 用 来 辅助 
编写 和 调试 程序 ) 等 。 其 中 一 些 工 具 的 功能 和 字 处 理 程序 、 电 子 制 表 软 件 、 电 子 邮 件 通信 系统 
等 差不多 ， 最 开始 是 为 一 般 应 用 开发 的 ， 现 在 已 为 软件 工程 师 所 采用 。 另 外 的 一 些 工 具 主要 是 
为 软件 工程 环境 专门 设计 的 相当 复杂 的 软件 包 。 实 际 上 ， 称 为 集成 开发 环境 (Integrated 
Development Environment，IDE) 的 系统 把 软件 开发 工具 (编辑 器 、 编 译 器 、 调 试 工具 等 ) 都 组 
合 到 了 单个 的 集成 程序 包 中 ， 其 中 ， 智 能 手机 开发 所 应 用 的 系统 便 是 这 类 系统 的 典型 代表 。 这 
类 系统 不 仅 提 供 编 写 和 调试 软件 所 必需 的 程序 设计 工具 ， 而 且 提 供 模拟 器 (借助 于 图 形 显示 ) 
让 程序 设计 人 员 查 看 正在 开发 的 软件 在 手机 上 的 实际 执行 情况 。 

除了 研究 人 员 、 专 业 人 士 和 标准 化 组 织 〈 包 括 ISO) 的 努力 ， 美国 计算 机 协会 (ACM) 和 
美国 电气 电子 工程 师 学 会 (IEEE) 也 已 经 加 入 到 改善 软件 工程 状态 的 战斗 中 。 这 些 努力 包括 ; 
采用 职业 行为 和 道德 准则 来 增强 软件 开发 人 员 的 职业 精神 ， 反 对 对 个 人 职责 的 漠视 态度 ， 建 立 
衡量 软件 开发 组 织 质量 的 标准 ， 提 供 帮 助 这 些 组 织 改善 它们 标准 的 指导 方针 。 
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美国 计 算 机 协会 ER for Computing Machinery，ACM ) ge 是 至 力 
于 推动 艺术 、 科 学 及 信息 技术 应 用 的 国际 性 科学 与 教育 组 织 。 其 总 部 在 纽约 ， 下 设 许多 特别 
兴趣 组 ( SIG )， 分 别致 力 于 计算 机 体系 结构 、 人 工 智 能 、 生 物 医 学 计算 、 计 算 机 与 社会 、 计 
算 机 科学 教育 、 计 算 机 图 形 学 、 超 文本 / 超 媒体 、 操 作 系 统 、 程 序 设计 语言 、 仿 真 与 建 模 ， 以 
及 软件 工程 等 主题 。ACM 的 网 站 地 址 是 http /www.acm.org。 其 道德 和 职业 行为 准则 可 在 
http//www.acm.org/constitution/code.html 中 找到 。 





美国 电气 电子 工程 师 学 会 (Institute of Electrical and Electronics Engineers，IEEE， 读 作 
“i-triple-e”) 是 一 个 电气 、 电 子 和 制造 工程 师 的 组 织 ,成 立 于 1963 年 ， 由 美国 电气 工程 师 学 会 
(由 包括 托马斯 .爱迪生 在 内 的 25 名 电气 工程 师 于 1884 年 创建 ) 和 美国 无 线 电工 程 师 学 会 ( 创 
建 于 1912 年 ) 合并 而 成 。 今 天 ，IEEE 的 运营 中 心 位 于 新 泽 西 州 的 皮 斯 卡 塔 书 镇 。 协 会 由 许多 
技术 分 会 组 成 ， ta 、 激 光 与 电光 学 学 会 、 机 器 人 与 自动 化 学 会 . 车载 技 术 

学 会 以 及 计算 机 学 会 。IEEE 也 参与 了 各 种 标准 的 开发 与 制定 。 例 如 ，IEEE 的 努力 产生 了 今天 
a a a 

IEEE 的 主页 地 址 是 http://www.ieee.org，IEEE 计 算 机 学 会 的 主页 地 让 戌 Dp /www. 

computer.org，IEEE 的 道德 准则 的 主页 地 址 是 http://www.ieee.org/about/whatis/code. html 。 


: 章 其 余部 分 将 讨论 软件 工程 的 基本 原理 (如 软件 生命 周期 和 模块 化 ), 介绍 软件 工程 的 发 
展 动向 (如 设计 模式 的 定义 与 应 用 以 及 可 复 用 软件 构件 的 出 现 ), 考察 面向 对 象 范 型 对 这 个 领域 
产生 的 影响 。 
问题 与 练习 


1. 为 什么 一 个 程序 的 代码 行 数 并 不 是 一 种 很 好 的 衡量 程序 复杂 性 的 度量 

2. 提出 一 种 测量 软件 质量 的 量度 建议 ， 并 说 明 这 种 量度 有 什么 缺点 ? 

3. 什么 样 的 技术 能 用 来 确定 一 个 软件 单元 中 有 多 少 错误 ? 

4. 列举 出 两 个 在 软件 工程 领域 中 已 经 在 改善 或 者 当前 正在 改善 的 应 用 环境 。 


7.2 ”软件 生命 周期 
软件 工程 最 基础 的 概念 就 是 软件 生命 周期 。 
7.2.1 周期 是 个 整体 


图 7-1 表 示 的 是 软件 生命 周期 ， 这 个 图 表明 了 一 个 事实 ， 即 软件 一 旦 开发 完成 ， 它 就 进入 了 
一 个 既 被 使 用 又 被 维护 的 周期 ， 这 个 周期 将 一 直 持 续 到 软件 生命 结束 。 这 种 模式 在 许多 工业 产 





G@ 此 地 址 已 失效 ， 新 地 址 为 http:/www:acm.ore/about-acm/acm-code-of-ethics-and-professional-conduct。 一 一 译 者 注 
@) 此 地 址 已 失效 ， 新 地 址 为 http://www.ieee.org/about/corporate/governance/p7-8.html。 译 者 注 
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品 中 也 很 常见 。 不 同 之 处 在 于 ， 对 于 其 他 产品 ， 维 护 阶 段 往往 是 一 个 修复 过 程 ， 而 对 于 软件 ， 
维护 阶段 往往 包括 改 错 和 更 新 。 实 际 上 ， 软 件 进入 维护 阶段 ， 是 由 于 以 下 的 原因 : 发 现 了 错误 ， 
软件 应 用 中 发 生 的 变化 需要 在 软件 中 做 相应 的 修改 ， 或 者 上 一 次 修改 中 的 变更 导致 软件 中 其 他 


地 方 出 现 了 问题 。 


图 7-1 软件 生命 周期 


无 论 软 件 因 为 什么 样 的 原因 进入 维护 阶段 ， 这 个 过 程 都 需要 有 人 【通常 不 是 原作 者 ) 研究 
底层 的 程序 及 其 文档 ， 直 至 把 这 个 程序 (或 者 至 少 是 这 个 程序 的 相关 部 分 理解 清楚 ; 否则 ， 
任何 的 改动 只 会 带 来 更 多 的 问题 。 即 使 软件 设计 精良 并 有 良好 的 文档 ， 要 达到 这 种 理解 也 是 一 
件 困 难 的 事情 。 事 实 上 ， 到 了 这 个 阶段 ， 软 件 的 某 部 分 往往 会 因为 “从 头 开发 一 个 新 系统 要 比 
成 功 修改 现 有 软件 包 更 容易 ”这 样 一 个 借口 (这 个 借口 通常 是 真实 的 ) 而 弃 之 不 用 。 

经 验 表明 ， 在 软件 开发 期 间 稍 作 努力 ， 就 可 能 会 在 需要 对 软件 进行 修改 时 产生 很 不 同 的 后 
果 。 例 如 ,在 第 6 章 对 数据 描述 语句 的 讨论 中 ， 我 们 可 以 看 出 ， 与 使 用 字面 量 相 比 ， 使 用 常量 会 
大 大 简化 未 来 的 修改 工作 。 结 果 是 ， 软 件 工程 的 大 部 分 研究 工作 集中 在 软件 生命 周期 的 开发 阶 
段 ， 以 利用 这 种 付出 与 收益 之 间 的 杠杆 作用 。 


7.2.2 ”传统 的 开发 阶段 
传统 的 软件 开发 生命 周期 的 主要 步骤 是 需求 分 析 、 设 计 、 实 现 和 测试 ( 见 图 7-2)。 


~ 


实现 
测试 
BD 


图 7-2 ”传统 的 软件 生命 周期 的 开发 阶段 


1. 需求 分 析 

软件 生命 周期 从 需求 分 析 开 始 ， 需 求 分 析 的 目标 是 ， 指定 预 期 系统 要 提供 的 服务 ; 确认 这 
些 服 务 的 运行 条 件 〈 如 时 间 限 制 、 安 全 性 等 );， 定义 外 界 与 系统 的 交互 方式 。 

需求 分 析 包 括 来 自 预 期 系统 的 利益 相关 者 (stakeholder, 将 来 的 使 用 者 , 还 有 其 他 有 关联 的 
人 ， 如 法 律 上 或 者 财务 上 相关 的 人 ) 提供 的 重要 数据 。 事 实 上 ， 在 一 些 情况 下 ， 终 端 用 户 是 一 
个 实体 (如 公司 或 政府 机 构 )， 他 们 会 为 软件 项 目的 实际 执行 雇用 软件 开发 者 ， 需求 分 析 可 能 会 
开始 于 用 户 独自 进行 的 可 行 性 研究 。 在 其 他 一 些 情况 下 ， 软 件 开发 者 可 能 会 为 大 众 市 场 生产 商 
用 现货 (Commercial Off-The-Shelf，COTS) 软件 ， 这 些 软件 或 许 在 零售 商店 销售 ， 或 许可 通过 
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因特网 下 载 。 在 这 种 情况 下 ， 用 户 不 再 是 准确 定义 的 实体 ， 需 求 分 析 可 能 要 从 软件 开发 者 的 市 
场 调 研 开 始 。 

无 论 是 哪 一 种 情况 ， 需 求 分 析 过 程 都 包括 : 收集 和 分 析 软 件 用 户 的 需求 ， 和 项 目的 利益 
相关 者 协商 ， 在 一 般 需 求 、 核 心 需 求 、 费 用 和 可 行 性 之 间 权 衡 ; 最 终 确定 的 需求 要 明确 最 终 
的 软件 系统 必须 具有 的 特性 和 服务 。 这 些 需 求 被 记录 在 一 个 称 为 软件 需求 规格 说 明 (software 
requirements specification document) 的 文档 中 。 从 某 种 意义 上 讲 ， 这 个 文档 是 所 涉及 的 各 方 之 
间 达 成 的 书面 协议 ， 它 的 目的 是 指导 软件 开发 ， 也 为 日 后 开发 过 程 中 可 能 产生 的 分 歧 提 供 解 决 
方法 。 像 IEEE 这 样 的 专业 组 织 和 美国 国防 部 这 样 的 大 型 软件 客户 都 已 经 采用 了 软件 需求 规格 说 
明文 档 编 写 的 标准 ， 这 些 事实 证 明 ， 软 件 需求 规格 说 明文 档 十 分 重要 。 

从 软件 开发 者 的 角度 来 看 ， 软 件 需 求 规格 说 明文 档 应 该 能 够 为 软件 开发 的 顺利 进行 制定 严 
格 的 目标 。 然 而 ， 大 多 数 情况 下 ， 需 求 文档 很 难 提供 这 种 稳定 性 。 事 实 上 ， 软 件 工程 领域 里 的 
大 多 数 实践 派 都 认为 : 在 软件 工程 产业 中 ， 导 致 成 本 超支 和 产品 交付 延期 的 最 主要 原因 就 是 不 
良 沟通 以 及 不 断 变化 的 需求 。 在 地 基 已 经 打 好 的 情况 下 ， 很 少 有 客户 会 坚持 对 楼 盘 的 建设 计划 
做 大 的 修改 ; 但 是 许多 组 织 机 构 在 软件 开始 构建 以 后 很 入， 仍然 不 断 扩 大 或 变更 软件 系统 需求 
的 实例 比比 皆 是 。 其 原因 可 能 是 公司 决定 把 原本 仅 为 附属 机 构 开 发 的 软件 系统 应 用 到 整个 公司 ， 
或 者 是 技术 的 进步 取代 了 初始 需求 分 析 中 可 用 的 功能 。 无 论 如 何 ， 软 件 工 程 师 们 发 现 ， 必 需 经 
常 与 项 目的 利益 相关 者 直接 沟通 。 

2. 设计 

如 果 说 需求 分 析 阶 段 提供 了 对 一 个 预期 软件 产品 的 描述 ， 那 么 设计 主要 是 为 预期 系统 的 构 
建 提出 一 个 计划 。 从 某 种 意义 上 讲 ， 需 求 分 析 阶 段 是 指明 要 解决 的 问题 ， 而 设计 阶段 则 是 制定 
问题 的 解决 方案 。 从 一 个 外 行人 的 视角 来 看 ， 需 求 分 析 阶 段 常 常 等 同 于 决定 软件 系统 应 该 做 些 
什么 ， 而 设计 阶段 则 是 决定 系统 如 何 完成 这 些 目标 。 虽 然 这 种 描述 是 有 意义 的 ， 但 很 多 软件 工 
程 师 认 为 它 是 有 缺陷 的 ， 因 为 实际 上 在 需求 分 析 阶 段 有 很 多 如 何 要 考虑 ， 在 设计 阶段 也 有 很 多 
什么 要 考虑 。 

软件 系统 的 内 部 结构 是 在 设计 阶段 建立 的 。 设 计 阶 段 的 结果 是 可 被 转化 为 程序 的 软件 系统 
结构 的 详细 描述 。 

如 果 项 目 是 建造 一 座 办 公 大 楼 ， 而 不 是 构建 一 个 软件 系统 ， 那 么 在 设计 阶段 应 该 为 大 楼 制 
订 详 细 的 结构 上 的 计划 并 力求 满足 指定 需求 。 例 如 ， 这 样 的 计划 应 该 包含 在 各 个 细节 层次 上 描 
述 所 建 大 楼 的 蓝图 汇总 。 有 了 这 些 文 档 ， 才 能 建造 实际 的 大 楼 。 制 订 这 些 计 划 的 技术 已 经 经 历 
多 年 的 发 展 ， 包 括 标准 的 符号 系统 以 及 大 量 的 建 模 和 图 形 化 方法 学 。 

同样 ， 在 软件 的 设计 中 ， 画 形 化 和 建 模 也 发 挥 着 很 大 的 作用 。 然 而 ， 软 件 工程 师 所 用 的 方 
法 学 和 符号 系统 与 建筑 领域 里 所 使 用 的 相 比 ， 稳 定性 不 太 好 。 与 建筑 学 这 个 成 熟 的 学 科 相 比 ， 
软件 工程 的 实践 显得 非常 动态 化 ， 因 为 软件 工程 的 研究 人 员 一 直 在 努力 地 寻找 软件 开发 过 程 中 
更 好 的 办 法 。 我 们 将 在 7.3 节 探究 这 个 不 断 变 化 的 领域 ， 并 在 7.5 节 详细 讨论 当前 的 符号 系统 以 及 
与 它们 相关 的 图 形 化 / 建 模 方法 学 。 

3. 实现 

实现 阶段 涉及 程序 的 具体 编号、 数据 文件 的 创建 和 数据 库 的 开发 。 在 实现 阶段 ， 我 们 会 看 
到 软件 分 析 员 (software analyst， 有 时 候 也 称 为 系统 分 析 员 ) 和 程序 员 (programmer) 之 间 任 务 
的 不 同 。 软 件 分 析 员 参与 整个 开发 过 程 ， 他 的 工作 重点 可 能 在 于 需求 分 析 与 设计 步 又， 而 程序 
员 的 主要 工作 是 实现 这 些 步 又 。 最 狭义 地 说 , 程序 员 负 责 写 程序 来 实现 软件 分 析 员 提出 的 设计 。 
尽管 我 们 做 了 这 样 的 区 分 ， 但 我 们 还 要 注意 ， 在 计算 机 领域 里 并 没有 一 个 总 的 权威 来 控制 术语 
的 使 用 。 许 多 有 着 软件 分 析 员 头衔 的 人 ， 本 质 上 就 是 程序 员 ， 而 许多 有 着 程 序 员 (也 许 是 高 级 
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程序 员 ) 头衔 的 人 ， 从 完全 意义 上 讲 实际 是 软件 分 析 员 。 我 们 很 快 就 可 以 看 到 ， 术 语 上 的 这 种 
模糊 是 因为 现在 软件 开发 过 程 中 的 步骤 经 常会 交叉 重 登 。 

4. 测试 

在 过 去 传统 的 开发 阶段 中 ， 测 试 本 质 上 等 同 于 调试 程序 和 确认 最 终 的 软件 产品 是 否 与 软件 
需求 规格 说 明文 档 相 一 致 的 过 程 。 但 是 如 今 ， 这 样 的 测试 观念 被 认为 太 过 狭隘 。 程 序 不 是 唯一 
在 软件 开发 过 程 中 被 测试 的 人 工 产品 ， 实 际 上 整个 开发 过 程 中 的 每 个 中 间 步 又 的 成 果 都 必须 进 
行 准确 性 “测试 "。 此 外 ,我 们 将 在 7.6 节 中 看 到 , 现在 测试 被 认为 是 为 全 面 保证 质量 所 作 努 力 
中 的 一 部 分 ， 这 一 目标 渗透 于 整个 软件 生命 周期 。 因 此 ， 很 多 软件 工程 师 认 为 测试 不 应 该 再 
被 看 作 是 软件 开发 过 程 中 独立 的 一 步 ， 而 是 “许多 的 事例 表明 ) 应 该 纳入 到 其 他 步骤 中 ， 形 
成 3 步 开 发 过 程 ， 其 中 每 一 步 都 应 该 有 自己 的 名 称 ， 如 “需求 分 析 和 确认 ” “设计 和 验证 ”以 及 
“实现 和 测试 ”。 

遗憾 的 是 ， 虽 然 有 现代 的 质量 保障 技术 ， 大 型 软件 系统 还 是 会 有 错误 ， 即 使 经 过 大 量 的 测 
试 也 不 能 避免 。 其 中 许多 错误 可 能 在 软件 的 生命 周期 内 都 检测 不 出 来 ， 但 是 另 一 些 错误 却 可 能 
会 造成 重大 的 故障 。 消 除 这 种 错误 是 软件 工程 的 目标 之 一 。 错 误 仍然 普遍 存在 的 事实 意味 者 还 
有 许多 研究 要 做 。 


问题 与 练习 
1. 软件 生命 周期 的 开发 阶段 是 如 何 影响 维护 阶段 的 ? 


2. 简要 说 明 软 件 生命 周期 之 开发 阶段 的 4 个 步骤 需求 分 析 、 设 计 、 实 现 和 测试 )。 
3. 试 简 述 软件 需求 规格 说 明文 档 的 作用 。 


me 
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软件 工程 早期 的 方法 强调 以 一 个 严格 的 顺序 进行 需求 分 析 、 设 计 、 实 现 和 测试 。 理 由 是 ， 
允许 大 型 软件 系统 在 开发 过 程 中 进行 变更 很 人 危险。 因此， 软件 工程 师 坚 持 : 在 设计 之 前 必须 先 
完成 整个 系统 的 需求 分 析 ， 而 且 ， 在 开始 实现 之 前 必须 先 完成 设计 。 结 果 产 生 了 一 个 现在 称 为 
瀑布 模型 (waterfall model〉 的 软件 开发 过 程 ， 之 所 以 称 这 种 开发 过 程 为 “瀑布 ”模型 ， 是 因为 
它 跟 瀑布 一 样 ， 只 能 向 一 个 方向 “流动 ”。 

近年 来 ， 瀑 布 模型 规定 的 高 度 结构 化 环境 与 “自由 发 挥 ” 的 试 错过 程 (通常 对 创造 性 的 问 
题 求解 至 关 重 要 ) 之 间 的 矛盾 ， 带 来 了 软件 工程 技术 的 变化 。 软 件 开 发 中 出 现 的 增 量 模型 
(incremental model) 就 说 明了 这 一 点 。 依 据 这 个 模型 ， 所 需 的 软件 系统 以 一 种 渐 近 的 模式 来 构 
建 ， 即 软件 产品 先是 以 功能 有 限 的 简化 版 本 出 现 ， 一 旦 这 个 版 本 的 系统 通过 了 测试 并 且 可 能 还 
经 过 了 未 来 用 户 的 评估 ， 就 可 以 以 递增 的 方式 不 断 地 向 系统 中 添加 更 多 的 功能 并 测试 ， 直 至 整 
个 系统 全 部 完成 。 例 如 ， 要 为 医院 开发 一 个 病人 记录 系统 ， 第 一 个 增 量 版 本 只 需要 能 够 查看 整 
个 记录 系统 中 的 一 小 部 分 病人 的 记录 样本 就 可 以 了 ， 一 旦 这 个 版 本 能 够 工作 ， 就 可 以 逐步 向 系 
统 中 加 入 其 他 功能 ， 如 增加 和 更 新 记录 的 功能 。 

另外 一 种 与 严格 遵循 瀑布 模型 不 同 的 模型 是 迭代 模型 (iterative model), 尽管 它 与 增 量 模型 
是 两 个 不 同 的 概念 ， 但 它们 是 相似 的 ， 实 际 上 有 时 它们 是 相同 的 。 增 量 模型 使 用 的 是 扩展 产品 
的 每 个 前 期 版 本 到 更 大 版 本 的 概念 ， 而 迭代 模型 使 用 的 是 改进 每 个 版 本 的 概念 。 实 际 上 ， 增 量 
模型 通常 会 包含 一 个 基本 的 迭代 过 程 ， 而 迭代 模型 常常 渐进 地 增加 特性 。 

一 个 典型 的 迭代 技术 的 例子 是 Rational Software Corporation 公司 创造 的 统一 软件 开发 过 程 





7.3 ”软件 工程 方法 学 235 


(Rational Unified Process，RUP， 与 “cup” 押 韵 )， 现 在 这 家 公司 是 IBM 的 一 个 分 公司 。RUP 在 
本 质 上 是 一 种 软件 开发 范 型 ， 它 重新 定义 了 软件 生命 周期 中 开发 阶段 的 每 一 个 步骤 ， 并 提供 
了 执行 这 些 步骤 的 指导 。IBM 公 司 将 这 些 指导 和 文 持 这 些 指导 的 CASE 工 具 当 作 商 品 出 售 。 现 
在 ，RUP 已 被 软件 领域 广泛 采用 。 事 实 上 ， 它 的 流行 促进 了 非 专利 版 本 一 一 统一 过 程 (unified 
process) 一 一 的 发 展 ， 这 在 非 商业 基础 上 非常 有 用 。 

增 量 模型 和 和 迭代 模型 有 时 会 利用 软件 开发 采用 原型 开发 (prototyping〉 的 这 种 趋势 ， 原 型 
开发 是 构建 并 评估 预 的 过 程 。 在 增 量 模 型 中 ， 
将 这 些 原型 发 展 为 一 个 最 终 的 完整 系统 的 过 程 称 为 演化 式 原型 开发 (evolutionary prototyping)。 
在 迭代 性 更 强 的 情况 下， 可 能 会 丢弃 原型 ， 以 使 得 最 后 设计 有 全 新 的 实现 ， 这 种 方法 称 为 抛弃 
式 原型 开发 (throwaway prototyping )。 快 速 原型 开发 (rapid prototyping) 通常 属于 抛弃 式 原 型 
开发 这 个 范畴 ， 这 种 方法 是 在 开发 过 程 的 早期 快速 构建 一 个 预期 系统 的 简单 原型 。 这 个 原型 可 
能 只 由 几 个 屏幕 图 像 构成 ， 用 来 演示 系统 将 如 何 与 用 户 交 互 以 及 系统 将 有 哪些 功能 。 其 目标 不 
是 产生 一 个 可 运行 的 产品 版 本 ， 而 是 获得 一 个 示范 工具 ， 用 来 澄清 软件 开发 过 程 所 涉及 的 各 个 
部 分 之 闻 的 通信 。 例 如 ， 事 实证 明 ， 快 速 原 型 有 利于 在 需求 分 析 阶 段 澄 清 系统 需求 ， 也 能 帮助 
在 销售 期 间 向 潜在 的 客户 进行 推销 介绍 。 

由 计算 机 爱好 者 /业余 爱好 者 使 用 多 年 的 增 量 和 迭代 思想 的 一 种 不 太 正 式 的 变 体 ， 称 为 开源 
开发 (open-source development)。 这 是 今天 许多 自由 软件 开发 采用 的 一 种 方式 。 最 著名 的 例子 
tT etter 该 系统 的 开源 开发 工作 最 初 是 由 林 纳 斯 。 托 瓦 效 〈Linus Torvald) 领 

的 。 软 件 包 的 开源 开发 遵循 以 下 过 程 : 先是 单个 作者 开发 一 个 初始 版 本 的 软件 〈 通 常 是 用 于 
et 自己 的 需求 ), 然后 将 其 源 代码 和 相关 文档 发 放 到 因特网 上 。 其 他 用 户 可 以 免费 下 载 
和 使 用 这 个 软件 。 由 于 这 些 “ 其 他 用 户 ” 拥 有 该 软件 的 源 代码 和 相关 文档 ， 他 们 能 够 修改 或 增 
强 这 个 软件 的 功能 以 使 之 满足 自己 的 需要 ， 或 者 是 改正 他 们 发 现 的 错误 。 接 下 来 ， 他 们 就 将 这 
些 改动 报告 给 原作 者 ， 原 作者 再 将 这 些 改动 整合 到 自己 发 布 的 软件 中 ， 使 软件 的 扩展 版 本 可 用 
于 更 进一步 的 修改 。 实 际 上 ， 一 个 星期 内 软件 包 就 有 可 能 经 过 几 次 的 扩展 。 

由 瀑布 模型 转化 而 来 的 变化 最 显著 的 方法 就 是 称 为 敏捷 方法 (agile method ) 的 方法 学 集合 ， 
它们 都 建议 在 增 量 的 基础 上 进行 早期 快速 的 实现 ， 响 应 需求 变更 ， 降 低 严格 需求 分 析 和 设计 的 
重要 性 。 敏 捷 方 法 的 一 个 例子 就 是 极限 编程 (Extreme Programming，XP)。 根 据 XP 模 型 ， 由 一 

个 少 于 12 人 的 团队 在 一 个 公共 的 工作 场所 自由 地 交换 想法 ， 在 开发 项 目 过 程 中 相互 协作 ， 通 过 
ER ee 设计 、 实 现 和 测试 ”这 样 一 个 周期 的 方式 ， 增 量 开发 软件 。 
这 样 ， 软 件 包 的 新 扩展 版 本 就 能 定期 出 现 ， 每 个 新 版 本 都 能 由 项 目的 利益 相关 者 进行 评估 ， 并 
以 此 为 基础 做 进一步 的 增 量 。 概 括 说 来 ， 敏 捷 方 法 具有 灵活 性 的 特点 ， 这 与 瀑布 模型 完全 相反 ， 
瀑布 模型 的 典型 情况 是 经 理 和 程序 员 在 各 自 的 办 公 室 工作 ， 各 自 严格 地 完成 整个 软件 开发 任务 
中 明确 定义 的 那 部 分 工作 。 

通过 瀑布 模型 与 XP 模 型 的 对 比 ， 揭 示 了 软件 工程 方法 学 的 广度 ， 这 些 方法 学 正 被 应 用 于 软 
件 开 发 过 程 ， 和 希望 能 找到 一 种 更 好 的 高 效 构建 可 靠 软件 的 方式 。 这 个 领域 的 研究 仍 在 继续 ， 虽 
然 取 得 了 一 定 的 进展 ， 但 还 有 许多 工作 要 做 。 


问题 与 练习 


1. 概述 软件 开发 的 传统 瀑布 模型 与 较 新 的 增 量 和 迭代 范 型 之 间 的 区 别 。 

2. 说 出 3 种 与 严格 遵循 瀑布 模型 不 同 的 开发 范 型 。 

3. 传统 的 演化 式 原型 开发 与 开源 开发 的 方法 之 间 的 区 别 是 什么 ? 

4. 对 于 通过 开源 方法 开发 的 软件 的 所 有 权 而 言 ， 你 认为 可 能 会 出 现 什 么 样 的 潜在 问题 ? 














和 = ke 
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7.4 模块 化 


7.2 节 中 有 一 个 关键 点 ， 要 修改 软件 ， 就 必须 理解 这 个 程序 ， 或 者 至 少 理解 这 个 程序 的 相关 
部 分 。 即 使 是 小 程序 ， 要 想 达 到 这 样 的 理解 一 般 也 很 困难 ， 而 对 于 大 型 的 软件 系统 ， 如 果 没 有 
模块 化 ‘modularity)， 那 几乎 是 不 可 能 的 。 模 块 化 就 是 把 软件 分 割 成 多 个 易于 处 理 的 通常 称 为 
模块 (module〉 的 单元 ， 每 个 单元 仅仅 承担 整个 软件 的 一 部 分 功能 。 


7.4.1 模块 式 实现 


模块 可 以 以 不 同 的 方式 实现 。 我 们 已 经 看 到 (第 5 章 和 第 6 章 )， 在 命令 型 范 型 的 环境 中 ， 模 
块 表现 为 函数 。 与 之 对 应 的 是 ， 面 向 对 象 范 型 则 是 利用 对 象 作为 其 基本 的 模块 要 素 。 这 些 差 别 
非常 重要 ， 因 为 它们 决定 了 最 初 的 软件 设计 过 程 中 的 潜在 目标 。 这 个 目标 是 将 全 部 任务 表示 为 
个 别 的 、 易 于 管理 的 过 程 ， 还 是 确定 系统 中 的 对 象 并 理解 它们 之 间 如 何 相 互 作用 ? 

为 了 说 明 这 一 点 ， 我 们 来 考虑 用 命令 型 范 型 和 面向 对 象 范 型 是 如 何 开 发 一 个 模拟 网 球 比 赛 
的 简单 模块 化 程序 的 。 在 命令 型 范 型 中 ,我们 首先 考虑 的 是 肯定 会 发 生 的 动作 。 因 为 每 场 网 球 比 
赛 都 是 从 一 名 选手 发 球 开始 ， 所 以 我 们 可 以 首先 考虑 构造 名 为 Serve 的 函数 (基于 选手 的 特点 ， 
可 能 还 有 一 点 儿 概率 )， 用 来 计算 球 的 初始 速度 和 方向 。 接 下 来 ， 我 们 需要 确定 球 的 路 径 。( 是 否 
将 撞 在 网 上 ? 它 将 弹 回 到 什么 地 方 ? ) 我 们 可 以 把 这 些 计 算 放 在 另外 一 个 名 为 ComputePath 的 函 
数 中 。 下 一 步 可 能 就 要 确定 另外 一 名 选手 是 否 能 击 回 这 个 球 。 如 果 能 够 击 回 这 个 球 ， 我 们 还 必 
须 计算 球 的 新 的 速度 和 方向 ， 可 以 把 这 些 计 算 放 在 名 为 Retuzn 的 函数 中 。 

照 这 样 继续 ， 我 们 可 以 构造 出 如 图 7-3 所 示 的 结构 图 (structure chart) 所 描述 的 模块 化 结构 。 在 
这 个 图 中 ， 函 数 用 和 矩形 表示 ， 函 数 之 间 的 依赖 关系 〈 由 函数 调用 来 实现 ) 用 箭头 表示 。 特 别 是 ， 这 
个 图 表明 了 整个 比赛 是 由 名 为 ControlGame 的 一 个 函数 来 控制 的 。 为 了 完成 工作 ,ControlGame 
函数 又 调用 了 Serve、Return、ComputePath 和 和 UpdateScore 这 4 个 函数 的 服务 。 





ContiolGame )，， 
Return ComputePath UpdateScore 


图 7-3 一 个 简单 的 结构 图 

注意 ， 这 个 结构 图 中 并 没有 描述 每 个 函数 是 如 何 完 成 自己 的 工作 的 ， 确 切 地 说 ， 这 个 图 仅 
仅 是 确定 了 函数 并 描述 了 函数 之 间 的 依赖 关系 。 事 实 上 ， ControlGame 函 数 要 完成 目 己 的 任务 
会 先 调用 Serve 函 数 , 然后 重复 调用 ComputePath 函 数 和 Return 函 数 ,， 直到 有 一 名 选手 没有 击 
中 球 为 止 。 最 后 ，ControlGame 在 调用 Serve 函 数 再 重复 以 上 整个 函数 之 前 , 调用 UpdateScore 
这 个 函数 的 服务 来 更 新 比分 。 

至 此 ， 我 们 仅仅 是 获得 了 所 需 系 统 的 一 个 极其 简单 的 框架 ， 但 思路 已 经 建立 起 来 了 。 按 照 
命令 型 范 型 ， 通 过 构思 系统 必须 实现 的 活动 ， 我 们 已 经 完成 了 程序 的 设计 并 得 到 了 设计 方案 ， 
其 中 的 模块 就 是 函数 。 

现在 ， 我 们 重新 考虑 这 个 程序 的 设计 ， 这 次 是 在 面向 对 象 范 型 的 环境 中 考虑 的 。 我 们 开始 
的 想法 就 是 用 两 个 对 象 PlayerA 和 PlayerB 来 表示 两 位 选手 。 这 两 个 对 象 将 有 同样 的 功能 和 不 
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同 的 特点 。( 两 名 选手 应 该 都 能 发 球 和 截击 球 ， 但 是 其 技巧 和 力度 不 同 。) 因此 ， 这 两 个 对 象 就 
是 同一 个 类 的 实例 。[ 回 忆 一 下 ， 我 们 在 第 6 章 介绍 了 类 的 概念 ， 类 是 定义 与 每 个 对 象 相关 联 的 
函数 〈 称 为 方法 ) 和 属性 〈 称 为 实例 变量 ) 的 模板 。] 我 们 把 这 个 类 称 为 PlayerClass， 它 将 
包含 Serve 方 法 和 Return 方 法 ， 用 来 模拟 选手 的 相应 动作 。 这 个 类 中 还 将 包括 选手 的 内 部 属性 
(如 skill 和 endurance 等 )， 这 些 属性 的 值 反 映 了 选手 的 特点 。 到 目前 为 止 ， 可 以 用 图 7-4 来 表 
示 我 们 的 设计 结果 。 从 图 中 可 以 看 出 ，PlayerA 和 PlayerB 是 Playerclass 类 的 两 个 实例 ， 而 
这 个 类 包含 了 Skill 属 性 和 Endurance 属 性 ， 同 时 也 包含 了 serve 方 法 和 returnVolley 方 法 。 
(注意 ， 在 图 7-4 中 我 们 已 经 用 下 划 线 标注 出 了 对 象 名 ， 以 此 来 区 分 它们 与 类 名 。) 


Perecss | 


Skill 
endurance 





图 7-4 PlayerClass 类 的 结构 和 它 的 实例 

接 下 来 ， 我 们 需要 一 个 对 象 来 实现 裁判 的 功能 ， 帮 助 判定 选手 完成 的 动作 是 否 合乎 规则 。 
例如 ， 发 球 是 否 过 网 ? 球 是 否 落 在 了 球场 的 合适 位 置 内 ? 为 此 ， 我 们 可 以 建立 一 个 名 为 Judge 
的 对 象 ， 该 对 象 包含 evaluateServe 方 法 和 evaluateReturn 方 法 。 如 果 Judge 对 象 判 定 发 球 
或 截击 球 合乎 规则 ， 那 么 比赛 继续 ;否则 ，Judge 对 象 会 给 男 一 个 名 为 Score 的 对 象 发 消息 ， 
告 之 它 记 录 下 相应 的 结果 。 

此 时 ， 网 球 程序 的 设计 包括 4 个 对 象 ; PlayerA、PlayerB、Judge 和 Score。 为 了 说 明 我 
们 的 设计 ， 考 虑 在 截击 中 可 能 发 生 的 事件 序列 ， 如 图 7-$ 所 示 ， 图 中 对 象 以 方 框 的 形式 来 表示 。 
这 个 图 是 要 把 对 象 之 间 的 通信 表示 成 调用 对 象 Playez&R 中 的 serve 方 法 的 结果 。 当 我 们 从 上 向 
下 依次 看 图 时 ， 会 发 现 事件 是 按 次 序 发 生 的 。 就 如 同 第 一 个 水 平 箭头 所 表示 的 那样 ，P1LayerR 
通过 调用 evaluateServe 方 法 向 对 象 Judge 报 告 它 的 发 球 ， 然 后 对 象 Judge 判 定 发 球 是 否 有 
Ra 日 通过 pe oder en pe 当 Judge 判 定 PlayerA 

上 E 错 误 ， 并 且 请 求 Score 对 象 记录 下 结果 时 ， 截 击 结束 。 


PlayerA PlayerB Judge Score 


{ 
1 evaluateServe 
1 


2 
1 
| A ! returnVolley 
PlayerA 调 用 Judge 中 4 


fh 时 bi 
的 万 法 evaluateServe evaluateReturn 


| 
! returnVolley 
1 
1 
1 
1 


evaluateReturn 





UpdateScore 


图 7-5 由 PlayerR&a 的 Serve 导 致 的 对 象 间 的 交互 
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和 命令 型 范 型 例子 的 情况 一 样 ， 面 向 对 象 程序 现 阶段 也 是 非常 简单 的 。 然 而 ， 我 们 已 经 取 
得 了 很 大 的 进步 ， 能 够 很 清楚 地 理解 面向 对 象 模式 下 是 如 何 进 行 模块 化 设计 的 ， 而 在 此 模块 化 
设计 中 ， 其 基本 的 构件 就 是 对 象 。 


7.4.2 耦合 


通过 前 面 的 介绍 我 们 知道 ， 模 块 化 是 开发 出 易于 管理 的 软件 的 一 条 途径 。 其 基本 思想 是 ， 
以 后 的 任何 修改 可 能 只 会 涉及 少数 几 个 模块 , 允许 个 人 对 系统 的 修改 只 集中 在 系统 的 有 关 部 分 ， 
而 不 是 整个 系统 。 当 然 ， 这 里 有 个 前 提 ， 就 是 对 一 个 模块 的 修改 不 会 无 意 中 影响 到 系统 的 其 他 
模块 。 因 此 ， 当 设计 一 个 模块 化 系统 的 时 候 ， 其 目标 就 应 该 是 做 到 模块 之 间 的 最 大 独立 性 ， 或 
者 换 名 话说， 就 是 使 两 个 模块 之 间 的 联系 尽 可 能 少 ， 这 种 联系 称 为 模块 之 间 的 耦合 (coupling )。 
事实 上 ， 用 来 衡量 软件 系统 复杂 性 〈 并 且 这 样 就 获得 了 一 种 估算 维护 软件 系统 的 所 需 开 销 的 方 
法 ) 的 一 个 指标 就 是 度量 该 系统 模块 间 的 耦合 。 

模块 间 的 耦合 有 多 种 形式 。 一 种 是 控制 耦合 〈control coupling)， 出 现在 一 个 模块 移交 执行 
控制 给 另外 一 个 模块 时 ， 如 函数 调用 的 情况 。 图 7-3 里 的 结构 图 就 表示 了 存在 于 两 个 函数 之 间 的 
控制 耦合 。 具 体 来 说 ， 从 ControlGame 模 块 到 Serve 模 块 之 间 的 箭头 说 明了 前 者 将 控制 权 传 弟 
给 后 者 。 图 7-5 中 的 结构 表示 的 也 是 一 个 控制 耦合 的 情况 ， 图 中 的 箭头 所 描绘 的 路 径 代 表 了 控制 
权 在 对 象 之 间 的 传递 。 

模块 间 的 另 一 种 形式 的 耦合 是 数据 耦合 (data coupling)， 这 是 指 两 个 模块 间 的 数据 共享 。 
如 果 两 个 模块 是 通过 共享 同一 个 数据 项 相互 作用 的 ， 那 么 当 对 一 个 模块 进行 修改 时 ， 可 能 会 影 
响 到 另外 一 个 模块 ， 并 且 对 数据 本 身 格式 的 修改 在 这 两 个 模块 中 都 会 有 反映 。 

两 个 函数 间 的 数据 耦合 有 两 种 形式 。 一 种 是 以 参数 的 形式 从 一 个 函数 到 另 一 个 函数 进行 显 
式 的 数据 传送 。 这 种 耦合 在 结构 图 中 是 用 两 个 函数 之 间 的 箭头 指示 数据 的 传送 ， 箭 头 的 方向 表 
明 在 此 方向 上 进行 数据 项 的 传送 。 例 如 ， 图 7-6 是 图 7-3 的 扩展 版 本 ， 在 此 图 中 ， 我 们 可 以 看 出 : 
当 ControlGame 函 数 调用 Serve 函 数 时 , ControlGame 函 数 会 将 需要 模拟 的 那 位 选手 的 特点 告 
知 给 Serve 函 数 ;， 当 Serve 函 数 完成 它 的 任务 时 ， 会 将 球 的 轨迹 报告 给 ControlGame 函 数 。 





区 册 a 
Re Bd 





图 7-6 “一 个 包含 数据 耦合 的 结构 图 


类 似 的 数据 耦合 也 发 生 在 面向 对 象 设计 中 的 两 个 对 象 之 间 。 例 如 ， 当 PlayerR 对 象 请 求 
Judge 对 象 对 其 发 球 进行 判定 时 ( 见 图 7-5),， 它 必须 将 球 的 轨迹 信息 传递 给 Judge 对 象 。 为 一 方 
面 ， 面 向 对 象 设 计 范 型 的 其 中 一 个 优势 就 在 于 它 从 本 质 上 倾向 于 将 两 个 对 象 之 间 的 数据 耦合 减 
小 到 最 低 。 这 是 因为 一 个 对 象 的 方法 倾向 于 包括 操作 这 个 对 象 内 部 数据 的 所 有 函数 。 例 如 ， 
PlayerR 对 象 将 包括 有 关 该 对 象 特点 的 信息 和 针对 这 些 信息 的 处 理 方法 。 因 此 ， 没 有 必要 将 这 
些 信息 传 递 给 男 外 一 些 对 象 ， 这 样 对 和 象 之 间 的 数据 看 合 就 最 小 化 了 。 

与 通过 参数 进行 显 式 数据 传递 的 方式 相反 ， 数 据 可 以 以 全 局 数据 (global data) 的 形式 在 模 
块 之 间 进行 隐 式 共享 。 全 局 数据 是 可 以 自动 被 整个 系统 中 的 所 有 模块 使 用 的 数据 项 。 这 与 局 部 
数据 项 不 同 ， 局 部 数据 项 只 能 在 某 个 特定 的 模块 中 使 用 ， 除 非 显 式 地 传递 给 了 另外 一 个 模块 。 
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大 多 数 高 级 语言 提供 了 全 局 数据 和 局 部 数据 的 实现 方式 ， 但 是 对 全 局 数据 的 使 用 应 当 谨慎 。 全 
局 数据 使 用 的 问题 在 于 ， 如 果 某 个 人 试图 修改 依赖 于 全 局 数据 的 一 个 模块 ， 那 么 他 就 很 难 确定 
正 被 修改 的 模块 与 其 他 模块 之 间 有 怎样 的 相互 关系 。 简 而 言 之 ， 全 局 数据 的 使 用 降低 了 模块 作 
为 一 种 抽象 工具 的 使 用 价值 。 


7.4.3 ”内 聚 


正如 模块 间 的 耦合 应 最 小 化 ， 同 样 重要 的 是 ， 每 个 模块 的 内 部 绑 定 程度 应 该 最 大 化 。 本 语 
内 聚 (cohesion) 就 用 来 表示 这 种 内 部 绑 定 ， 或 者 说 模块 内 部 各 部 分 的 关联 程度 。 为 充分 理解 内 
聚 的 重要 性 ， 必 须 考 察 系统 的 最 初 开发 并 考虑 这 个 软件 的 整个 生命 周期 。 如 果 有 必要 在 模块 中 
作出 修改 ， 那 么 存在 于 模块 中 的 各 种 不 同 的 活动 会 搅乱 原本 简单 的 一 个 过 程 。 所 以 ， 软 件 设计 
人 员 在 寻求 模块 间 的 低 耦 合 的 同时 ， 还 力求 做 到 模块 内 部 的 高 内 聚 。 

一 种 较 弱 的 内 聚 形式 称 为 逻辑 内 聚 (logical cohesion )。 模 块 内 的 逻辑 内 聚 是 由 其 内 部 元 素 
本 质 上 实现 逻辑 上 相似 的 活动 所 引起 的 。 例 如 ， 考 虑 一 个 模块 ， 它 完成 整个 系统 与 外 界 进行 通 
信 的 功能 。 粘 合 这 个 模块 的 “胶水 ”是 模块 中 的 所 有 活动 都 用 以 处 理 通 信 。 然 而 ， 通 信 的 各 个 
主题 差别 很 大 ， 有 些 可 能 是 用 来 获取 数据 的 ， 其 他 一 些 可 能 是 用 来 报告 结果 的 。 

一 种 较 强 的 内 聚 形式 称 为 功能 内 聚 (functional cohesion)， 即 模块 中 所 有 部 分 都 集中 于 实现 
某 一 项 功能 。 在 命令 型 范 型 的 设计 中 ， 功 能 内 聚 的 程度 通常 可 以 通过 把 其 他 模块 中 的 子 任务 独 
立 出 来 用 作 抽 象 工 具 来 增强 。 这 一 点 在 网 球 模拟 示例 中 得 到 了 很 好 的 说 明 (再 次 参见 图 7-3)， 
在 该 示例 中 ControlGame 模 块 将 其 他 模块 用 作 抽 象 工具 ， 以 便 它 能 集中 调度 整个 比赛 ， 而 不 是 
把 精力 分 散在 实现 发 球 、 回 击 球 和 维护 比分 这 样 的 细节 上 。 

在 面向 对 象 设计 中 ， 因 为 对 象 中 的 方法 常常 执行 松散 相关 的 活动 ， 其 唯一 的 共同 “纽带 ” 
就 是 它们 都 是 由 同一 个 对 象 执行 的 活动 ， 所 以 全 部 的 对 象 通常 都 是 逻辑 上 内 聚 的 。 例 如 ， 在 网 
球 模拟 示例 中 ， 每 个 选手 对 象 都 包含 发 球 和 回击 球 的 方法 ， 这 些 方法 是 明显 不 同 的 活动 ， 所 以 
这 样 一 个 对 象 仅仅 是 一 个 逻辑 上 的 内 聚 模块 。 然 而 ， 软 件 设 计 人 员 应 当 力 求 做 到 使 一 个 对 象 中 
的 每 个 方法 都 在 功能 上 内 聚 。 也 就 是 说 ， 即 使 对 象 在 整体 上 仅仅 是 逻辑 上 内 聚 ， 对 象 里 的 每 个 
方法 也 应 当 只 实现 一 个 功能 内 聚 的 任务 〈 见 图 7-7)。 


对 象 






对 象 中 每 个 方 
_， 法 都 是 功能 上 
一 /内 聚 的 


图 7-7 一 个 对 象 的 逻辑 内 聚 和 功能 内 聚 


7.4.4 信息 隐藏 
信息 隐藏 (information hiding) 是 好 的 模块 化 设计 的 一 个 基本 特征 ,， 它 指 的 是 限制 软件 系统 
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的 指定 部 分 的 信息 。 这 里 的 术语 信息 应 该 从 广义 阐释 ， 它 包括 关于 程序 单元 结构 和 内 容 的 任何 
知识 。 因 此 ， 它 包括 数据 、 用 到 的 数据 结构 类 型 、 编 码 系 统 、 模 块 的 内 部 组 成 结构 、 过 程 单元 
的 逻辑 结构 和 任何 涉及 模块 内 部 特性 的 其 他 因素 。 

信息 隐藏 的 关键 就 是 阻止 模块 的 动作 对 其 他 模块 产生 不 必要 的 依赖 或 影响 。 否 则 ， 模 块 的 
有 效 性 就 可 能 会 受到 影响 ， 可 能 是 受 其 他 模块 开发 中 错误 的 影响 ， 也 可 能 是 受 软件 维护 期 间 不 
正确 的 维护 的 影响 。 例 如 ， 如 果 一 个 模块 不 限制 其 他 模块 对 其 内 部 数据 的 使 用 ， 那 么 这 个 模块 
内 部 的 数据 可 能 就 会 被 其 他 模块 破坏 。 或 者 ， 如 果 一 个 模块 被 设计 成 要 利用 另 一 个 模块 的 内 部 
结构 ， 那 么 后 面 在 另 一 个 模块 的 内 部 结构 被 修改 时 ， 这 个 模块 可 能 会 产生 错误 。 

要 注意 到 信息 隐藏 具有 两 个 化 身 ， 这 是 非常 重要 的 : 一 个 是 作为 设计 目标 的 ， 男 一 个 是 作 
为 实现 目标 的 。 应 当 这 样 设 计 一 个 模块 : 使 其 他 模块 不 需要 读 取 它 的 内 部 信息 ， 并 且 应 当 以 强 
化 模块 边界 的 方式 实现 一 个 模块 。 前 者 的 例子 是 最 大 化 内 聚 和 最 小 化 耦合 。 后 者 的 例子 涉及 使 
用 局 部 变量 、 应 用 封装 和 使 用 定义 明确 的 控制 结构 。 

最 后 ， 我 们 应 该 注意 到 ， 信 息 隐 藏 对 于 抽象 主题 和 抽象 工具 的 使 用 极为 重要 。 实 际 上 ， 抽 
象 工 具 的 概念 是 “ 黑 盒 ”的 概念 ， 用 户 可 以 忽略 它 的 内 部 特性 ， 这 样 就 允许 用 户 集中 考虑 手头 
更 大 的 应 用 。 在 这 种 情况 下 ， 信 息 隐 藏 相当 于 封装 抽象 工具 的 概念 ， 就 像 安 全 单 可 以 用 来 保护 
复杂 的 、 具 有 潜在 风险 的 电子 设备 一 样 。 保 护 它们 的 用 户 远离 内 部 危险 ， 同 样 也 保护 内 部 ， 以 
防 来 自 其 他 用 户 的 侵扰 。 


7.4.5 构件 
我 们 已 经 提 到 ， 软 件 工程 领域 里 的 一 个 障碍 就 是 缺乏 预制 的 “现成 的 ”构件 块 来 构建 大 型 
的 软件 系统 。 在 这 一 点 上 ， 软 件 开发 中 的 模块 化 方法 让 我 们 看 到 了 和 希望。 特别 是 ， 事 实证 明 ， 


面向 对 象 程序 设计 范 型 尤其 有 用 ， 因 为 对 象 来 自 完 备 的 、 自 我 包含 的 单元 ， 这 些 单 元 明确 定义 
了 与 其 外 部 环境 的 接口 。 一 旦 一 个 对 象 〈 更 准备 地 说 ， 是 一 个 类 ) 被 设计 成 能 完成 某 种 特定 功 
能 ， 它 就 可 以 在 任何 要 求 提 供 这 种 服务 的 程序 中 用 来 实现 这 个 功能 。 此 外 ， 在 对 象 定义 必须 定 
制 以 符合 一 个 特定 应 用 的 需要 的 情况 下 ， 继 承 提供 了 一 种 对 预制 对 象 的 定义 进行 改进 的 手段 。 
于 是 ， 面 向 对 象 编 程 语 言 Ct+、Java 以 及 C# 都 带 有 多 套 预制 的 “模板 ”这 一 点 就 不 足 为 奇 了 。 
通过 这 些 模 板 ， 程 序 员 可 以 很 方便 地 实现 对 象 并 用 来 完成 特定 功能 。 有 具体 来 说 ，C++ 有 C++ 标准 
模板 库 ，Java 编 程 环境 有 Java 应 用 程序 员 接 口 (Java Application Programmer Interface，API)，C# 
程序 员 可 以 访问 .NET 框 架 类 库 。 

虽然 对 象 和 类 实际 有 可 能 为 软件 设计 提供 预制 的 构建 块 ， 但 这 并 不 意味 着 它们 就 是 理想 的 
选择 。 一 个 问题 是 ， 它 们 提供 相对 较 小 的 模块 来 构建 系统 ， 所 以 对 象 实际 上 是 更 通用 的 构件 
Ccomponent) 概念 中 的 一 个 特例 ， 构 件 就 是 软件 的 一 个 可 复 用 单元 。 实 际 上 ， 大 多 数 构件 都 是 
基于 面向 对 象 范 型 的 ， 并 且 表 现 为 一 个 或 多 个 对 象 组 成 的 集合 的 形式 ， 其 功能 是 作为 一 个 自 包 
含 单元 。 

构件 的 开发 和 利用 的 研究 导致 了 称 为 构件 架构 (component architecture， 也 就 是 通常 所 说 的 
基于 构件 的 软件 工程 ) 的 领域 的 出 现 。 在 此 领域 中 ， 传 统 的 程序 员 被 构件 装配 员 (component 
assembler) 所 代替 ， 由 构件 装配 员 把 预制 的 构件 装配 成 软件 系统 。 在 许多 开发 环境 中 ， 常 常用 
图 形 界 面 中 的 图 标 来 表示 预制 的 构件 。 构 件 装配 员 并 不 涉及 构件 内 部 的 编程 ， 而 是 在 预先 定义 
好 的 构件 集合 中 选择 相关 的 构件 ， 然 后 将 它们 进行 最 小 化 的 定制 并 连接 ， 从 而 获得 所 需要 的 功 
能 。 确 实 ， 一 个 设计 好 的 构件 的 属性 就 是 不 需要 经 过 内 部 的 修改 就 可 以 进行 扩展 ， 来 包含 一 些 
针对 特定 应 用 的 特性 。 

构件 架构 在 智能 手机 系统 这 一 领域 中 尚 无 用 武之 地 。 因 为 这 些 设备 的 资源 有 限 ， 各 个 应 用 
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实际 是 组 相互 协作 的 构件 ， 每 个 构件 会 为 其 应 用 提供 一 个 具体 的 功能 。 例 如 ， 一 个 应 用 中 的 每 
we 通常 都 是 一 个 独立 的 构件 。 在 其 背后 ， 可 能 存在 其 他 服务 构件 ， 用 于 存储 和 访问 存储 卡 

上 的 信息 、 执行 革 沾 持续 的 功能 《如 播放 音乐)， 或 用 于 通过 因特网 访问 信息 ; 每 一 个 这 样 的 
件 都 按 需 独立 启动 和 终止 ， 高 效 地 服务 于 用 户 ， 然 而 ,应 用 本 身 的 显示 和 动作 看 起 来 像 是 一 体 的 。 





以 下 情节 是 现实 世界 的 软件 工程 师 所 面临 的 典型 问题 。XYZ 公 司 聘 请 一 家 软件 工程 公司 
为 其 开发 、 安 装 一 套 全 公司 的 集成 软件 系统 ， 以 满足 公司 的 数据 处 理 需要 。 作 为 系统 的 一 部 
分 ，XYZ 公 司 又 建立 了 一 个 PC 网 络 ， 让 员工 用 来 访问 这 个 全 公司 系统 。 因 此， 每 个 员工 的 办 
公 虽 上 都 有 一 台 PC。 很 快 这 些 PC 不 仅 能 用 来 访问 新 的 数据 管理 系统 ， 而 且 可 以 作为 可 定制 的 
工具 ， 让 员工 用 其 来 提高 自己 的 工作 产 出 。 例 如 ， 某 名 员工 可 以 开发 一 个 电子 制 表 程 序 来 简化 
自己 的 工作 任务 。 壮 憾 的 是 ， 这 样 一 个 定制 的 应 用 可 能 设计 并 不 完善 或 者 没有 经 过 彻底 的 测 
试 ， 而且 可 能 会 涉及 一 些 这 名 员工 并 不 能 完全 理解 的 特性 。 随 着 年 限 的 增加 ， 这 些 定制 的 应 用 
程序 慢 慢 会 融合 到 公司 的 内 部 事务 处 理 过 程 中 。 与 此 同时 ， 当 初 开发 这 些 应 用 程序 的 员工 可 能 
会 升迁 、 调 任 或 者 离开 这 家 公司 ， 而 使 用 这 些 程序 的 其 他 同事 却 并 不 懂 这 些 程序 .。 结果， 起 初 
的 一 个 精心 设计 、 协 调 一 致 的 系统 会 变 成 一 个 设计 不 良 的 、 无 文档 的 、 易 出 错 的 应 用 的 拼凑 品 。 


问题 与 练习 

1. 小 说 与 百科 全 书 在 其 单元 (如 章 、 节 以 及 条 目 ) 之 间 在 耦合 程度 方面 有 什么 不 同 ? 内 聚 方面 呢 ? 

2. 一 项 体育 赛事 通常 会 被 划分 为 一 些 单元 。 例 如 ， 棒 球 比赛 被 分 成 了 儿 局 ， 网 球 比赛 被 分 成 了 儿 盘 。 试 
分 析 两 个 这 类 “模块 ”之 间 的 耦合 性 。 这 类 单元 的 内 聚 到 了 怎样 的 程度 ? 

. 最 大 程度 的 内 聚 与 最 小 程度 的 耦合 的 目标 是 否 一 致 ? 也 就 是 说 ， 随 着 内 聚 度 的 增加 ,耦合 度 会 相应 降 
低 吗 ? i 

定义 耦合 、 内 聚 和 信息 隐藏 。 

扩展 图 7-3 中 的 结构 图 ， 使 其 包括 两 个 模块 ControlGame 与 JpdateScore 之 间 的 数据 看 合 。 

如 果 PlayerA 的 发 球 因 违反 规则 被 视 为 无 效 ， 绘 制 一 幅 类 似 于 图 7-5 的 图 ， 表 示 发 生 的 事件 序列 。 
传统 的 程序 员 与 构件 装配 员 之 间 有 什么 区 别 ? 

假设 大 多 数 智能 手机 都 有 一 些 个 人 组 织 应 用 (如 日 历 、 联 系 人 、 曾 钟 、 社 交 网 络 、 电 子 邮 件 系统 、 地 
图 等 )》 ， 你 认为 构件 功能 的 哪些 组 合 实用 而 有 趣 呢 ? 


Ly) 


的 


7.5 行业 工具 


本 节 里 ， 我 们 研究 一 些 在 软件 开发 的 分 析 与 设计 阶段 使 用 的 建 模 技术 和 符号 系统 。 其 中 一 
些 技术 和 符号 系统 是 在 软件 工程 学 科 中 以 命令 型 范 型 为 主导 的 年 代 里 开发 的 。 现 在 ， 在 面向 对 
象 范 型 环境 中 也 可 以 找到 它们 中 某 些 的 身影 ， 而 另外 的 一 些 如 结构 图 (再 见 图 7-3) 则 是 专门 用 
于 命令 型 范 型 的 。 我 们 首先 考虑 一 些 从 其 命令 型 范 型 发 展 而 来 的 技术 ， 然 后 研究 一 些 较 新 的 面 
向 对 象 的 工具 和 设计 模式 的 扩展 功能 。 


7.5.1 较 老 的 工具 
尽管 命令 型 范 型 致力 于 依据 过 程 或 函数 来 构建 软件 ， 但 确定 这 些 函 数 的 方式 是 考虑 将 被 操 





242 第 7 章 软件 工程 


作 的 数据 ， 而 不 是 函数 本 身 。 上 有 具体 思路 是 ， 通 过 研究 数据 在 系统 中 如 何 流动 ， 就 能 确定 在 哪儿 
更 改 数据 格式 ， 或 者 在 哪儿 对 数据 的 路 径 进 行 合并 或 拆 分 。 因 此 ， 就 确定 了 进行 处 理 的 位 置 ， 
这 样 一 来 ， 通 过 数据 流 的 分 析 就 能 确定 函数 。 数 据 流 图 (dataflow diagram) 是 表示 从 数据 流 分 
析 过 程 中 所 获得 的 信息 的 一 种 手段 。 在 数据 流 图 中 ， 箭 头 表 示 数 据 路 径 ， 椭 圆 表示 数据 操控 发 
生 的 地 点 ， 和 矩形 表示 数据 源 和 数据 存储 。 作 为 一 个 示例 ， 图 7-8 表 示 的 是 医院 病人 计 费 系统 的 一 
个 基本 的 数据 流 图 。 注 意 ， 该 图 表明 Payments 从 病人 中 “流出 ”的 ) 和 PatientRecords 
(从 医院 文件 中 “流出 ”的 ) 在 顶 圆 ProcessPayments 处 合并 ， 并 从 此 处 将 UpdaatedRecords 
“ 流 回 ”到 医院 文件 。 


病人 记录 





图 7-8 一 个 简单 的 数据 流 图 


数据 流 图 不 仅 能 在 软件 开发 的 设计 阶段 帮助 确定 过 程 , 还 能 在 分 析 阶 段 帮 助理 解 预期 系统 。 
实际 上 ， 构 建 数 据 流 图 可 以 作为 一 种 用 来 改善 客户 与 软件 工程 师 之 间 的 交流 的 手段 (因为 软件 
工程 师 一 直 为 理解 客户 需要 什么 而 努力 并 且 客 户 努 力 描 述 个 人 愿望 )， 所 以 , 即使 在 命令 型 范 型 
已 经 不 太 流 行 的 情况 下 ， 这 些 数据 流 图 仍然 在 使 用 。 

软件 工程 师 已 经 用 了 很 多 年 的 另 一 种 工具 就 是 数据 字典 (data dictionary )， 它 是 关于 整个 软件 
系统 中 出 现 的 数据 项 的 一 个 中 央 信 息 库 。 这 些 信息 包括 : 为 引用 每 个 数据 项 所 采用 的 标识 符 、 每 个 
数据 项 里 的 有 效 条 目的 构成 情况 (数据 项 一 直 是 数字 型 的 ， 还 是 一 直 是 字符 型 的 ? 分 配给 该 数据 项 
的 值 的 可 能 范围 是 什么 )、 数 据 项 存储 在 什么 地 方 〈 数 据 项 是 要 存储 在 文件 中 或 数据 库 中 吗 ? 如 果 
是 ， 有 具体 存储 在 哪 一 个 里 面 )、 软 件 在 什么 地 方 会 引用 这 些 数 据 项 〈 哪 些 模块 需要 数据 项 的 信息 )。 

构建 数据 字典 的 一 个 目标 是 ， 增 强 软 件 系统 的 利益 相关 者 与 软件 工程 师 之 间 的 沟通 ， 其 中 
软件 工程 师 负 责 将 利益 相关 者 的 需求 转化 为 需求 规格 说 明文 档 。 在 这 样 的 环境 下 ， 构 建 数据 字 
典 有 助 于 确保 这 样 一 个 事实 ， 即 如 果 部 分 数字 不 是 真正 的 数字 型 的 ， 那 么 在 软件 的 分 析 阶 段 就 
可 以 发 现 ， 而 不 用 等 到 在 后 面 的 设计 和 实现 阶段 才 发 现 。 构 建 数据 字典 的 男 一 目标 是 确立 整个 
系统 的 一 致 性 。 借 助 构建 字典 常常 可 发 现 元 余 和 矛盾。 例如 ， 一 个 数据 项 在 库存 记录 中 称 为 
PartNumber， 而 在 销售 记录 中 可 能 就 改称 为 PartId。 还 有 ， 人 事 部 门 可 能 会 用 数据 项 Name 
来 表示 一 名 员工 ， 而 库存 记录 可 能 会 用 数据 项 Name 来 表示 一 个 零件 。 
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在 面向 对 象 范 型 出 现 以 前 ， 数 据 流 图 和 数据 字典 是 软件 工程 “武器 库 ” 中 的 工具 ， 在 命令 型 范 
型 现在 已 经 不 太 流 行 的 情况 下 《这些 工 具 最 初 是 针对 命令 型 范 型 开发 的 )， 这 些 工 具 还 是 能 继续 找 
到 适合 它们 的 角色 ,现在 , 我 们 转 而 研究 更 为 先进 的 称 为 统一 建 模 语言 (Unified Modeling Language， 
UML) 的 工具 集 。 统 一 建 模 语 言 是 基于 面向 对 象 范 型 思想 发 展 而 来 的 。 然 而 ， 在 这 个 工具 集中 , 我 
们 讨论 的 第 一 个 工具 是 用 例 图 (use case diagram),， 无 论 其 潜在 的 范 型 如 何 ， 这 个 工具 都 是 非常 有 用 
的 ， 因 为 它 仅 仅 尝试 着 从 用 户 的 视角 来 捕捉 预期 系统 的 画面 。 图 7-9 表 示 的 就 是 用 例 图 的 一 个 例子 。 
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图 7-9 ”一 个 简单 的 用 例 图 
用 例 图 是 用 大 的 矩形 框 来 描述 预期 系统 ， 在 这 个 矩形 框 中 ， 系 统 与 其 用 户 之 间 的 交互 一 一 称 





为 用 例 (use case) 一 一 是 用 椭圆 来 表示 的 ， 而 系统 中 的 用 户 一 一 称 为 参与 者 (actor) 一 一 是 用 
火柴 人 表示 的 《即使 角色 可 能 不 是 一 个 人 ， 也 这 么 表示 )。 这 样 ， 图 7-9 所 表示 的 就 是 预期 的 
Hospital Records System, 该 系统 在 获得 Physician 和 Nurse 的 请 求 时 , 就 会 完成 Retrieve 
Medical Records 这 个 用 例 。 

鉴于 用 例 图 是 从 预期 软件 系统 的 外 部 来 观察 系统 的 ， 所 以 UML 提 供 了 许多 种 工具 ， 用 于 表 
示 系 统 内 部 的 面向 对 象 设计 。 其 中 的 一 种 工具 是 类 图 (class diagram)， 它 是 一 个 符号 系统 ， 用 
来 表示 类 的 结构 和 两 个 类 之 间 的 关系 一 一 在 UML 的 术语 中 称 为 关联 (assosiation)。 举 一 个 例子 ， 
考虑 医生 、 病 人 和 病房 之 间 的 关系 ， 我 们 假定 表示 这 些 实体 的 对 象 是 分 别 从 类 Physician、 
Patient 和 Room 构造 出 来 的 。 

图 7-10 表 明了 这 三 个 类 之 间 的 关系 在 UML 类 图 中 是 如 何 表 示 的 ， 其 中 ， 和 矩形 框 表 示 类 ， 线 表示 关 
联 。 对 关联 线 可 以 标记 ， 也 可 以 不 标记 ， 如 果 标 记 ， 可 以 用 实心 箭头 来 指明 标号 被 读 的 方向 。 例 如 ， 
在 图 7-10 中 带 标记 cares foz 的 箭头 指示 医生 照顾 病人 ， 而 不 是 病人 照顾 医生 。 有 时 关联 线 上 带 有 两 
个 标记 ， 可 以 从 任 一 方向 读 取 关 联 。 图 7-10 中 的 类 Patient 和 Room 之 间 的 关联 就 例证 了 这 一 点 。 


ET 1 + io 或 1 occupies A 
有 cares for hosts 


图 7-10 一 个 简单 的 类 图 
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除了 指明 两 个 类 之 间 的 关联 之 外 ， 类 图 还 能 表达 这 些 关 联 的 多 样 性 。 也 就 是 说 ， 它 能 指明 
一 个 类 的 多 少 个 实例 与 男 一 个 类 的 实例 相关 联 。 这 个 信息 被 记录 在 关联 线 的 两 端 。 图 7-10 指 明 
每 位 病人 可 以 占据 一 个 房间 ， 而 每 个 房间 能 容纳 0 位 或 1 位 病人 。( 我 们 假定 每 个 房间 都 是 私人 房 
间 。) 星 号 (*) 表示 一 个 任意 的 非 负数 ， 因 此 ， 图 7-10 中 的 * 表 示 每 位 医生 可 以 照顾 多 位 病人 ， 而 
在 关联 的 医生 端的 1 表示 每 位 病人 只 由 一 位 医生 照顾 。( 我 们 的 设计 只 考虑 主治 医生 这 个 角色 。) 

为 了 完整 性 起 见 ， 我 们 应 该 注意 到 关联 的 多 样 性 有 3 种 基本 形式 : 一 对 一 关系 、 一 对 多 关系 
和 多 对 多 关系 ， 如 图 7-11 所 示 。 一 对 一 关系 (one-to-one relationship) 的 一 个 例子 就 是 病人 和 私 
人 病房 之 间 的 关系 ， 其 中 每 位 病人 只 能 分 配 到 一 个 房间 ， 而 且 每 个 病房 只 分 配给 一 位 病人 。 一 
对 多 关系 〈one-to-many relationship) 的 一 个 例子 就 是 医生 和 病人 之 间 的 关系 ， 其 中 每 位 医生 可 
以 照顾 多 位 病人 ， 而 每 位 病人 只 有 一 位 〈 主 治 ) 医生 照顾 。 在 这 个 例子 中 ， 当 我 们 考虑 将 病人 
与 咨询 医生 之 间 的 联系 加 入 病人 与 医生 之 间 的 关系 时 ， 就 形成 了 多 对 多 关系 (many-to-many 
relationship), 即 每 位 病人 可 以 有 多 位 咨询 医生 来 辅助 治疗 , 而 每 位 咨询 医生 可 以 帮助 多 个 病人 。 


= 一 对 多 多 对 多 

X 类 型 Y 类 型 X 类 型 Y 类 型 X 类 型 Y 类 型 
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| | 一 一 一 上 

加 一 一 一 一重 

本 一 一 一 各 

恒 一 一 本 = 


图 7-11 X 类 型 的 实体 与 Y 类 型 的 实体 之 间 的 一 对 一 、 一 对 多 以 及 多 对 多 关系 


在 面向 对 象 设计 中 ， 有 一 种 经 常 出 现 的 情况 : 一 个 类 表示 另 一 个 类 的 更 加 具体 的 版 本 。 在 这 种 情 
况 下 ， 我 们 说 后 者 是 前 者 的 泛 化 。UML 提 供 了 区 

一 种 特殊 的 表示 泛 化 的 符号 。 图 7-12 给 出 了 一 个 
例子 , 它 描述 了 类 MedicalRecord、Surgical 
Record 和 OfficeVisitRecord 之 间 的 泛 化 ,两 
个 类 之 间 的 关联 用 带 空心 箭头 的 箭头 表示 , 这 是 
UML 表 示 泛 化 的 关联 符号 。 注 意 ， 每 一 个 类 都 
由 一 个 矩形 表示 ， 里 面包 含 了 类 的 名 称 、 属 性 和 
方法 , 格式 见 图 7-4。 这 是 UML 在 类 图 中 表示 类 的 
内 在 特征 的 方式 。 图 7-12 中 描述 的 信息 是 : 

MedicalRecord 类 是 SurgicalRecord 类 的 泛 
化 ， 同 时 也 是 OfficeVisitRecord 类 的 泛 化 。 

也 就 是 说 ，SurgicalRecord 类 和 OfficeVisit 
Record 类 包含 了 MedicalRecord 类 的 所 有 
特性 ， 并 附加 了 那些 明确 地 列 在 它们 和 矩形 框 中 加 下 us 

的 特性 。 因 此 ，SurgicalRecord 类 和 Office 图 7-12 ”描述 泛 化 的 一 个 类 图 
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VisitRecord 类 都 包含 病人 、 医 生 和 记录 日 期 ， 只 是 SurgicalRecord 类 还 包含 手术 流程 、 医 院 、 
出 院 日 期 和 准许 病人 出 院 的 权力 ， 而 0fficeVisitRecord 类 包含 了 症状 和 诊断 。 这 3 个 类 都 有 
打印 医疗 记录 的 功能 。SurgicalRecord 类 和 OfficeVisitRecord 类 中 的 PrintRecord 方 法 
是 MedicalRecord 类 中 PrintRecord 方 法 的 特 化 ， 它 们 都 可 以 打印 其 类 特有 的 信息 。 

回顾 第 6 章 (6.5 节 )， 在 面向 对 象 编程 环境 中 实现 泛 化 的 一 个 很 自然 的 方式 就 是 利用 继承 。 
然而 ， 许 多 软件 工程 师 都 告诫 说 ， 继 承 并 不 是 对 所 有 的 泛 化 情况 都 适合 。 原 因 在 于 ， 继 承 导 致 
了 两 个 类 之 间 的 强 耦 合 度 ， 这 种 耦合 是 软件 生命 周期 的 后 期 不 希望 出 现 的 。 例 如 ， 类 的 改变 会 
自动 在 它 的 所 有 继承 类 中 得 到 反映 ， 因 此 在 软件 维护 阶段 看 起 来 很 小 的 改动 就 能 够 导致 不 可 预 
见 的 后 果 。 作 为 一 个 例子 ， 我 们 假设 一 个 公司 为 其 员工 开放 了 一 个 娱乐 设施 ， 这 也 就 意味 着 娱 
乐 设施 里 的 所 有 具有 成 员 资格 的 人 员 都 是 该 公司 的 员工 。 为 了 给 这 个 设施 做 一 个 成 员 表 ， 程 序 
员 可 以 利用 继承 依据 早先 已 经 定义 的 Employee 类 构建 一 个 RecreationMember 类 。 但 是 ， 如 
果 随 着 公司 后 来 的 效益 提高 ， 公 司 决 定 对 员工 的 家 属 和 退休 员工 也 开放 娱乐 设施 ， 就 必须 切断 
Employee 类 和 RecreationMember 类 之 间 内 含 的 看 合 。 所 以 ， 使 用 继承 的 时 候 不 应 当 只 考虑 其 
方便 性 ， 而 应 当 将 继承 的 使 用 严格 限制 在 需要 实现 的 泛 化 一 直 不 会 更 改 的 情况 下 。 

类 图 代表 的 是 程序 设计 中 的 静态 特性 征 ， 它 们 不 能 表示 程序 在 执行 过 程 中 发 生 的 事件 序列 。 为 
了 表示 这 种 动态 特征 ，UML 提 供 了 一 系列 的 图 表 类 型 ， 它 们 统称 为 交互 图 (interaction diagram )。 
交互 图 的 一 种 是 序列 图 (sequence diagram)， 它 描述 了 完成 一 个 任务 所 涉及 的 个 体 〈 如 参与 者 、 完 
整 的 软件 构件 或 个 体 对 象 ) 彼此 之 间 的 通信 。 这 些 图 与 图 7-5 类 似 ， 因 为 它们 都 用 带 有 向 下 延伸 的 
虚线 的 矩形 表示 个 体 。 每 个 窍 形 连 同 它 的 虚线 称 为 生命 线 (ife line)。 两 个 个 体 间 的 通信 用 连接 合 
适 生 命 线 的 带 标记 的 箭头 表示 ， 这 里 的 标记 指示 的 是 被 请 求 的 动作 。 当 自 顶 向 下 阅读 图 时 ， 这 些 箭 
头 是 按时 间 先 后 次 序 出 现 的 。 当 个 体 完 成 请 求 的 任务 ， 并 把 控制 返回 给 发 出 请 求 的 个 体 〈 就 像 传统 
的 从 一 个 过 程 返回 ) 时 ， 这 时 的 通信 是 用 一 个 指 回 原始 生命 线 的 无 标记 箭头 表示 的 。 

因此 ， 图 7-5 从 本 质 上 讲 是 一 个 序列 图 。 但 是 ， 图 7-$ 的 语法 本 身 有 几 个 缺点 。 一 个 就 是 它 
不 允许 我 们 获取 两 名 选手 之 间 的 对 称 ， 我 们 必须 画 出 一 个 单独 的 图 来 表示 开始 于 PlayerB 发 球 
的 截击 球 ， 即 使 其 交互 序列 与 PlayerA 发 球 的 非常 相似 。 此 外 ， 图 7-5 只 描述 了 一 次 具体 的 截击 
球 ， 一 次 一 般 的 截击 球 活动 肯定 可 以 无 限 延 展 。 形 式 化 序列 图 有 在 单个 图 中 获取 这 些 变 化 的 技 
术 ， 虽 然 我 们 不 需要 仔细 研究 这 些 ， 但 还 是 应 该 简要 地 看 一 下 图 7-13 中 显示 的 形式 化 序列 图 ， 
它 描 述 了 基于 我 们 的 网 球 比 赛 设计 的 一 个 一 般 的 截击 球 活动 。 

还 要 注意 ， 图 7-13 说 明了 整个 序列 图 是 包含 在 一 个 矩形 一 一 帧 〈frame) 一 一 中 的 。 帧 的 左 
上 和 角 是 一 个 包含 了 跟 有 标识 符 的 字符 sd (意思 是 “sequence diagram”) 的 五 角形 ， 这 个 标识 符 可 
能 是 标记 整体 序列 的 名 字 ， 也 可 能 〈 如 图 7-13 中 的 ) 是 被 调用 来 初始 化 序列 的 方法 的 名 字 。 注 
意 ， 与 图 7-$ 对 比 ， 图 7-13 中 表示 选手 的 矩形 并 没有 指定 具体 的 选手 ， 而 仅仅 表明 了 它们 代表 的 
是 PlayerClass“ 类 型 ”的 对 象 。 其 中 一 个 被 指定 为 self， 意 思 是 这 是 一 个 其 serve 方 法 被 激活 
去 初始 化 序列 的 对 象 。 

图 7-13 中 需要 注意 的 另外 一 点 是 ， 它 处 理 了 两 个 内 部 的 矩形 ， 即 用 来 表示 一 个 图 中 候选 序 
列 的 交互 段 〈interaction fragment)。 图 7-13 包 含 了 两 个 交互 段 ， 一 个 标记 为 “loop”， 男 一 个 标 
记 为 “alt”。 这 本 质 上 是 我 们 首次 在 5.2 节 Python 中 遇 到 的 while 和 if-else 结 构 。“loop” 交 互 段 表明 
其 边界 内 的 事件 将 重复 , 重复 的 条 件 是 Judge 对 象 判定 validPlay 的 值 为 真 ;“alt” 交 互 段 表明 
根据 fromServer 的 值 是 真是 假 ， 其 中 一 个 候选 序列 被 执行 。 

最 后 ， 在 这 里 介绍 类 -职责 -协作 卡 (Class-Responsibility-Collaboration card， 简 称 CRC 卡 ) 
的 功能 还 是 比较 合适 的 ， 尽 管 这 部 分 内 容 不 属于 UML， 但 它 在 验证 面向 对 象 设计 的 有 效 性 方面 
起 着 很 重要 的 作用 。CRC 卡 是 一 张 简单 的 卡片 ， 如 索引 卡片 ， 上 面 写 着 有 关 对 象 的 描述 。 利 用 
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这 种 方法 ， 软 件 设 计 师 为 预期 系统 的 每 个 对 象 做 一 张 卡片 ， 然 后 用 这 些 卡 片 在 系统 的 模拟 中 表 
示 对 象 ， 这 个 模拟 可 能 在 桌面 上 进行 ， 也 可 能 通过 一 个 “戏剧 ”实验 进行 ， 在 实验 中 ， 设 计 团 
队 的 每 个 成 员 手 持 一 张 卡片 ， 扮 演 卡 片上 描述 的 对 象 的 角色 。 这 样 的 模拟 通常 称 为 结构 化 走 查 
(structured walkthrough)， 人 们 发 现在 设计 实现 之 前 的 设计 阶段 找 错 很 有 用 。 
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图 7-13 ”描述 一 般 截 击 球 的 序列 图 
7.5.3 ”设计 模式 


对 软件 工程 师 而 言 , 越 来 越 有 用 的 工具 是 不 断 发 展 的 设计 模式 集 。 设计 模式 (design pattern) 
是 用 来 解决 软件 设计 过 程 中 反复 出 现 的 问题 的 一 种 预先 开发 的 模型 。 例 如 ， 适 配器 模式 提供 了 
一 个 解决 办 法 ， 用 来 解决 通过 预制 模块 来 构建 软件 的 过 程 中 经 常 出 现 的 问题 。 具 体 来 说 ， 预 制 
模块 可 能 已 经 具备 了 解决 手边 问题 的 功能 ， 但 可 能 还 没有 与 当前 应 用 相 兼 容 的 接口 。 在 这 样 一 
种 情况 下 ， 适 配器 模式 可 以 用 作 一 种 将 一 个 模块 “封装 ”在 另外 一 个 模块 里 的 标准 方法 ， 仅 仅 需 
要 为 原始 模块 的 接口 与 外 部 世界 提供 翻译 功能 , 这 样 一 来 , 就 允许 原始 的 预制 模块 用 于 该 应 用 中 。 

另 一 种 成 熟 的 设计 模式 是 装饰 者 模式 ， 它 提供 了 一 种 用 来 设计 系统 的 手段 ， 而 所 设计 的 系 
统 依据 当时 的 环境 完成 一 些 相同 活动 的 不 同 组 合 。 这 种 系统 会 产生 大 量 的 选择 ， 如 果 没 有 经 过 
仔细 的 设计 ， 很 可 能 导致 软件 极其 复杂 。 但 是 ， 装 饰 者 模式 提供 了 一 个 实现 这 类 系统 的 标准 化 
方式 ， 从 而 产生 了 一 种 易于 管理 的 解决 办 法 。 








所 遇 到 的 问 是 该 机 器 的 设 
受 计 的 缺陷 包括 : (1 ) 机 器 界 
射 : 适 值 之 前 就 能 进行 放射 操作 ，(2 ) 硬件 

. 致 了 某 些 安全 性 能 的 失效 。 
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在 一 些 更 近 的 例子 中 ， 有 因 设 计 不 当 导 致 的 大 面积 停电 、 电 话 服务 中 断 、 金 融 业 务 的 重 
大 错误 、 空 间 探测 器 的 失踪 以 及 因特网 的 竣 疾 .。 如 果 你 想 对 这 类 问题 有 更 多 的 了 解 ， 请 查阅 
风险 论坛 ， 它 的 网 址 是 http://catless.ncl.ac.uk/Risks,. 


设计 模式 中 的 重复 问题 的 识别 以 及 设计 模式 的 创建 和 分 类 在 软件 工程 领域 里 是 一 个 不 断 进 
步 的 过 程 。 然 而 ， 其 目标 不 仅仅 是 找到 设计 问题 的 解决 办 法 ， 还 要 找到 高 质量 的 解决 方案 ， 这 
种 解决 方案 在 软件 生命 证 周期 的 后 期 能 提供 很 好 的 灵活 性 。 因 此 ， 对 诸如 耦合 最 小 化 和 内 聚 最 大 
化 这 样 好 的 设计 原则 的 考虑 ， 在 设计 模式 的 发 展 过 程 中 起 着 重要 的 作用 。 

设计 模式 在 发 展 过 程 中 所 取得 的 进展 成 果 ， 在 今天 的 软件 开发 包 所 提供 的 工具 库 中 得 到 了 
体现 ， 如 Oracle 公 司 提供 的 Java 编 程 环境 以 及 微软 公司 提供 的 .NET 框 架 等 。 事 实 上 ， 在 这 些 工 
具 包 中 找到 的 许多 模板 本 质 上 是 设计 模式 的 框架 ， 它 们 为 设计 问题 提供 了 现成 的 、 高 质量 的 解 
决 方案 。 

最 后 我 们 要 提 到 的 是 ， 软 件 工 程 里 的 设计 模式 的 出 现 是 不 同 的 领域 相互 促进 的 一 个 很 好 的 
例子 。 设 计 模 式 的 起 源 来 自 于 克里斯托弗 。 亚 历 山 大 (Christopher Alexander) 在 传统 建筑 领域 
里 的 研究 , 他 的 目标 是 发 现 那 些 提 高 建筑 设计 质量 的 特征 , 然后 开发 包含 这 些 特征 的 设计 模式 。 
今天 ， 软 件 设计 中 已 经 包含 了 他 的 许多 思想 ， 并 且 许 多 软件 工程 师 仍 继续 从 他 所 做 的 工作 中 汲 
取 灵 感 。 


问题 与 练习 

1. 画 一 个 数据 流 图 ， 表 示 一 名 读者 从 图 书馆 借 书 时 发 生 的 数据 流 。 

2. 画 出 图 书馆 记录 系统 的 用 例 图 。 

3. 画 一 个 类 图 ， 表 示 旅 客 与 他 们 所 住 酒店 之 间 的 关系 。 

4. 画 出 一 个 类 图 ， 表 示 一 个 事实 一 一 人 是 雇员 的 泛 化 。 包 括 一 些 可 能 每 个 人 都 有 的 属性 。 
5. 把 图 7-5 转 化 为 完整 的 序列 图 。 Ca 

6. 在 软件 工程 过 程 中 ， 设 计 模 式 扮演 着 什么 样 的 角色 ? 


ET ST TE HEE 


7.6 质量 保证 


软件 故障 、 成 本 超支 、 错 过 截止 时 间 等 现象 的 激增 ， 对 软件 质量 控制 方法 的 改进 提出 了 要 
求 。 本 节 我 们 考虑 一 些 在 此 方面 的 努力 方向 。 


7.6.1 质量 保证 的 范围 


在 计算 机 编程 发 展 的 早期 ， 生 产 优质 软件 的 关注 点 主要 集中 在 去 除 在 实现 过 程 中 产生 的 编 
程 错误 上 。 在 本 节 的 后 面 ， 我 们 将 讨论 在 这 个 方向 上 取得 的 进步 。 然 而 ， 如 今 软件 质量 控制 的 
范围 远 超出 了 调试 过 程 ， 它 的 分 支 包 括 软 件 工 程 过 程 的 改进 ， 培 训 课程 〈 其 中 很 多 是 为 认证 设 
置 的 ) 的 开设 ， 以 及 标准 《在 这 些 标准 之 上 可 以 建立 健全 的 软件 工程 ) 的 确立 。 在 这 方面 ， 我 
们 已 经 注意 到 像 IO、IEEE 和 ACM 这 些 组 织 在 提升 职业 化 程度 和 设立 标准 〈 以 评估 软件 开发 公 
司 内 部 的 质量 控制 ) 方面 所 起 的 作用 。 一 个 典型 的 例子 是 ISO 9000 系 列 标准 ， 它 涉及 到 了 许多 
工业 活动 ， 如 设计 、 生 产 、 安 装 和 服务 。 另 外 一 个 例子 是 ISOAIEC 15504， 它 是 由 ISO 和 国际 电 
工 委员 会 (IEC) 联合 制定 的 一 套 标 准 。 

现在 许多 软件 承包 商 要 求 他 们 雇用 来 开发 软件 的 组 织 符合 这 样 的 标准 。 因 此 ， 软 件 开发 公 
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司 正在 建立 软件 质量 保证 (Software Quality Assurance，SQA ) 小 组 ， 负 责 监 督 和 强制 执行 组 织 
所 采用 的 质量 控制 系统 。 例 如 ， 在 传统 的 瀑布 模型 下 ，SQA 小 组 将 负责 在 设计 阶段 开始 之 前 批 
准 软件 需求 规格 说 明 ， 或 在 实现 阶段 开始 之 前 批准 设计 及 相关 的 文档 。 

许多 主题 构成 了 当今 质量 控制 的 基础 ， 其 中 之 一 就 是 保存 记录 。 最 重要 的 是 将 开发 过 程 中 
的 每 一 步 都 准确 地 记 入 文档 以 供 将 来 参考 。 但 是 ， 这 个 目标 与 人 类 的 本 性 相 冲 突 ， 人 的 本 性 使 
得 人 们 倾向 于 在 作出 决定 或 改变 决定 时 不 更 新 相关 文档 。 因 此 ， 记 录 有 可 能 是 不 正确 的 ， 从 而 
在 未 来 阶段 使 用 它 时 很 有 可 能 会 产生 误导 。 在 这 一 方面 ,CASE 工具 具有 非常 大 的 好 处 ， 它 们 使 
得 像 重 画图 表 和 更 新 数据 字典 这 类 任务 与 手工 方法 相 比 ， 要 更 加 容易 。 因 此 ， 记 录 更 可 能 会 
更 新 ， 最 终 的 文档 也 更 可 能 是 准确 的 。( 这 只 是 软件 工程 必须 应 对 人 性 弱点 的 多 个 实例 之 一 ， 
其 他 的 例子 包括 当 人 们 共事 时 ， 不 可 避免 的 个 性 冲突 、 嫉 妨 和 自我 抵触 。) 

另 一 个 面向 质量 的 主题 是 评审 的 使 用 ， 其 中 涉及 软件 开发 项 目的 各 方 聚 在 一 起 ， 考 虑 一 个 
指定 的 话题 。 评 审 贯穿 整个 软件 开发 过 程 ， 采 用 的 形式 是 : 需求 评审 、 设 计 评 审 和 实现 评审 。 
在 需求 分 析 的 早期 ， 评 审 可 能 表现 为 : 原型 演示 ， 软件 设计 团队 成 员 间 的 结构 化 走 查 ;或 者 实 
现 设 计 相 关 部 分 的 程序 员 间 的 协调 。 这 样 的 评审 〈 基 于 重复 的 基础 ) 提供 了 沟通 的 渠道 ， 通 过 
它 可 以 避免 误解 ， 在 错误 造成 灾难 前 更 正 错 误 。 评 审 的 重要 性 已 经 被 这 样 的 事实 例证 : 在 IEEE 
标准 中 ， 对 于 软件 评审 有 专门 的 论述 ， 这 就 是 众所周知 的 IEEE 1028。 

有 些 评审 在 本 质 上 是 关键 的 。 一 个 例子 就 是 ， 项 目 利 益 相 关 者 的 代表 和 软件 开发 团队 之 间 
就 批准 最 终 软件 需求 规格 说 明 所 进行 的 评审 。 实 际 上 ， 这 个 批准 标志 着 正式 需求 分 析 阶 段 的 结 
束 ， 同 时 它 也 是 后 续 要 进行 的 开发 过 程 的 基础 。 但 是 ， 从 质量 控制 的 角度 来 说 ， 所 有 的 评审 都 
是 重要 的 ， 它 们 都 应 该 记 入 文档 ， 作 为 不 断 进行 的 记录 维护 过 程 的 一 部 分 。 


7.6.2 ”软件 测试 


软件 质量 保证 现在 被 认为 是 贯穿 整个 开发 过 程 的 一 个 主题 ， 程 序 的 测试 和 验证 本 身 一 直 是 
研究 的 主题 。 在 5.6 节 中 ， 我 们 讨论 了 用 严格 的 数学 方法 验证 算法 正确 性 的 技术 ， 但 结论 是 如 今 
大 多 数 软件 要 使 用 测试 来 “验证 ”遗憾 的 是 ， 这 种 测试 在 最 好 的 情况 下 也 不 精确 。 除 非 我 们 对 
一 个 软件 做 足够 多 的 测试 ， 穷 尽 所 有 可 能 的 情况 ， 和 否则 还 是 不 能 保证 这 个 软件 是 正确 的 。 即 使 
是 简单 的 程序 ， 也 可 能 有 无 数 条 可 以 遍历 的 路 径 。 所 以 ， 对 一 个 复杂 的 程序 的 所 有 可 能 的 路 径 
进行 测试 是 不 可 能 的 。 

男 一 方面 ， 软 件 工程 师 已 经 开发 出 了 一 些 测试 方法 ， 在 经 过 有 限 次 测试 的 情况 下 ， 可 提高 
发 现 软件 错误 的 可 能 性 。 其 中 一 种 是 基于 这 样 的 观察 ， 即 软件 中 的 错误 趋 于 类 聚 。 也 就 是 说 ， 
经 验 表 明 ， 一 个 大 型 的 软件 系统 中 会 有 一 小 部 分 模块 比 其 他 模块 更 容易 出 问题 。 所 以 ， 与 其 把 
所 有 的 模块 都 进行 相同 的 、 不 彻底 的 测试 ， 还 不 如 确定 那些 容易 出 错 的 模块 ， 对 它们 进行 彻底 
的 测试 ， 这 样 可 以 发 现 系 统 的 更 多 错误 。 这 就 是 所 谓 的 帕 累 托 法 则 (Pareto principle) 的 一 个 实 
例 ， 该 法 则 援引 自 意 大 利 经 济 学 家 、 社 会 学 家 维尔 弗 雷 多 ，。 帕 累 托 (Vilfredo Pareto，1848 一 1923 )， 
他 发 现 意 大 利 的 一 小 部 分 人 口 控 制 了 意大利 的 大 部 分 财富 。 在 软件 工程 领域 , 帕 累 托 法 则 指出 ， 
通过 对 一 个 集中 区 域 施加 作用 ， 往 往 就 可 以 明显 地 改变 结果 。 

软件 测试 的 男 一 种 方法 称 为 基本 路 径 测试 (basis path testing )， 这 种 方法 要 开发 出 一 组 测试 
数据 ， 并 且 这 组 数据 要 能 保证 软件 中 的 每 条 指令 都 能 至 少 执行 一 次 。 人 们 已 经 用 数学 领域 的 图 
论 开 发 出 了 确定 这 种 测试 数据 集 的 技术 。 因 此 ， 虽 然 不 可 能 保证 通过 软件 系统 的 每 条 路 径 都 得 
到 测试 ， 但 是 可 以 做 到 在 测试 过 程 中 ， 系 统 的 每 条 语句 都 至 少 能 执行 一 次 。 

基于 帕 累 托 法 则 和 基本 路 径 测 试 的 技术 都 依赖 于 对 被 测试 软件 的 内 部 构成 的 理解 ， 因 此 这 
类 测试 都 属于 所 谓 的 白 盒 测试 (glass-box testing) 这 一 类 ， 这 也 就 意味 着 软件 测试 人 员 要 了 解 
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软件 的 内 部 结构 ， 在 设计 测试 的 时 候 要 利用 到 这 些 知识 。 相 反 ， 还 有 一 类 测试 称 为 黑 盒 测 试 
(black-box testing)， 这 类 测试 并 不 依赖 于 对 软件 内 部 构成 的 了 解 。 简 而 言 之 ， 黑 盒 测 试 是 从 用 
户 的 角度 来 完成 的 。 在 黑 盒 测试 过 程 中 ， 测 试 人 员 并 不 关心 软件 本 身 是 如 何 工 作 的 ， 而 只 注重 
软件 在 精确 度 和 时 间 性 方面 是 否 能 正确 执行 。 

黑 盒 测试 的 一 种 方法 是 称 为 边界 值 分 析 (boundary value analysis) 的 技术 ， 它 包括 确定 数 
据 范围 ( 即 等 价 类 ， 软 件 应 以 类 似 的 方式 操作 它们 〉 和 用 接近 这 些 范围 的 边界 数据 测试 软件 。 
例如 ， 如 果 软 件 需 要 接受 指定 范围 内 的 输入 值 ， 那 么 就 可 以 用 这 个 范围 内 的 最 低 值 和 最 高 值 对 
该 软件 进行 测试 ， 或 者 如 果 软 件 需要 协调 多 个 活动 ， 那 么 就 应 针对 尽 可 能 大 的 活动 的 集合 进行 
测试 。 基 于 的 理论 是 : 通过 确定 等 价 类 ， 测 试用 例 的 数量 可 以 最 小 化 ， 因 为 对 于 一 个 等 价 类 内 
的 几 个 例子 的 正确 操作 往往 可 验证 整个 类 的 软件 。 此 外 ， 确 定 一 个 类 内 错误 的 最 佳 机 会 是 使 用 
类 边界 上 的 数据 。 

黑 盒 测试 的 另外 一 种 方法 是 pg 测试 (beta testing), 在 产品 的 最 终 版 本 稳定 下 来 向 市 场 发 布 之 
前 ,软件 的 初步 版 本 会 被 发 给 一 部 分 预期 受众 ， 以 了 解 软件 在 现实 环境 中 的 表现 如 何 。[ 在 开发 
者 现场 进行 的 类 似 测试 称 为 a 测试 (alpha testing)。] B 测 试 的 优点 远 远 不 止 传统 的 错误 发 现 。 通过 
这 种 测试 所 获得 的 普通 用 户 的 反馈 意见 (无 论 正面 或 负面 ) 将 有 助 于 调整 市 场 策略 。 此 外 ， 早 
些 时 候 发 布 的 beta 版 的 软件 有 助 于 其 他 软件 开发 者 设计 出 与 之 兼容 的 产品 。 例 如 ， 就 PC 市 场 的 
新 操作 系统 来 说 ， 其 beta 版 本 的 发 布 会 鼓励 与 之 兼容 的 工具 软件 的 开发 ， 这 样 最 终 版 的 操作 系 
统 上 市 时 ， 就 已 经 有 与 之 相配 的 软件 产品 出 现 。 此 外 ，beta 版 软件 的 存在 会 在 市 场 上 造成 一 种 
对 软件 产品 的 期 待 〈 营 造 一 种 增加 推广 和 销量 的 氛围 )。 


问题 与 练习 


. 软件 开发 组 织 内 的 SQA 小 组 的 作用 是 什么 ? 

. 人 性 是 以 什么 方式 与 质量 保证 对 立 的 ? 

. 说 出 两 种 在 开发 过 程 中 用 来 加 强 质量 的 主题 。 

. 在 测试 软件 时 ， 一 个 成 功 的 测试 是 指 一 个 发 现 了 错误 的 测试 ， 还 是 指 一 个 没有 发 现 错误 的 测试 ? 

. 为 了 确定 系统 中 的 哪些 模块 应 该 接受 比 其 他 模块 更 为 彻底 的 测试 ， 你 会 建议 采用 什么 技术 ? 

. 一 个 软件 包 设 计 用 来 对 不 超过 100 个 条 目的 列表 进行 排序 ， 请 问 ， 对 此 软件 包 采 用 什么 样 的 测试 最 为 
合适 ? 
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7.7 文档 


如 果 人 们 不 能 学 会 使 用 和 维护 软件 系统 ， 那 么 这 个 软件 系统 也 就 没 多 大 的 用 处 。 因 此 ， 文 
档 是 最 终 软件 包 的 一 个 重要 的 部 分 ， 而 文档 的 编写 也 就 成 了 软件 工程 领域 里 的 一 个 重要 课题 。 

软件 文档 有 3 个 用 途 ， 因 而 也 就 可 以 将 文档 划分 为 3 类 : 用 户 文档 、 系 统 文档 以 及 技术 文档 。 
用 户 文档 (user documentation〉 用 来 解释 软件 的 特性 ， 并 描述 如 何 使 用 软件 。 用 户 文档 是 给 软 
et 因而 其 编写 采用 的 是 应 用 方面 的 术语 。 

， 用 户 文档 被 公认 为 是 一 种 重要 的 市 场 工 具 。 好 的 用 户 文档 加 上 精心 设计 的 用 户 界 面 ， 
We ， 从 而 提高 软件 销量 。 正 因为 认识 到 这 一 点 ， 许 多 软件 开发 人 员 
蝗 请 熟悉 技术 的 编写 人 员 为 其 编制 产品 的 文档 ， 或 者 将 自己 软件 产品 的 初级 版 本 提供 给 独立 作 
者 ， 这 样 ， 当 开始 向 公众 发 布 软件 正式 版 时 ， 书 店 里 也 就 同时 有 了 关于 如 何 使 用 该 软件 的 书籍 。 

用 户 文档 传统 上 是 纸 质 书籍 或 小 册子 形式 ， 但 是 许多 情况 下 同样 的 信息 也 包含 在 该 软件 中 
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成 为 其 组 成 部 分 。 这 使 读者 在 使 用 软件 时 能 参考 文档 。 在 这 种 情况 下 ， 信 息 可 能 会 分 割 成 小 单 
元 ， 有 时 称 为 帮助 包 ， 当 用 户 在 两 个 命令 之 间 犹 豫 不 决 时 ， 帮 助 包 中 的 信息 可 以 自动 出 现在 显 
示 屏 上 。 

系统 文档 (system documentation) 用 来 描述 软件 的 内 部 构成 ， 便 于 在 软件 日 后 的 生命 周期 
中 进行 维护 。 系 统 文档 的 一 个 主要 部 分 是 系统 中 所 有 程序 的 源 代码 版 本 。 这 些 源 代码 版 本 应 以 
易 读 的 格式 呈现 ， 这 一 点 很 重要 ， 这 就 是 软件 工程 师 为 什么 支持 “采用 精心 设计 的 高 级 程序 设 
计 语 言 、 采 用 注释 语句 对 程序 进行 注释 ， 以 及 采用 以 一 臻 单元 表示 每 一 个 模块 的 模块 化 设计 ” 
的 原因 。 实 际 上 ， 大 多 数 软件 开发 公司 都 有 一 定 的 要 求 其 员工 在 编写 程序 的 时 候 遵 循 的 约定 。 
例如 ， 使 程序 编写 得 有 条 理 的 缩 进 约定 ;， 建立 变量 、 常 量 、 对 和 象 以 及 类 等 不 同 程 序 结构 的 命名 
约定 ; 以 及 保证 所 有 程序 都 能 有 效 地 文档 化 的 文档 约定 。 这 些 约定 在 整个 公司 的 软件 中 都 是 统 
一 的 ， 这 样 最 终 就 能 简化 软件 的 维护 过 程 。 

系统 文档 的 另外 一 个 组 成 部 分 是 设计 文档 的 记录 ， 其 中 包括 软件 需求 规格 说 明和 显示 这 些 
规格 说 明 在 设计 期 间 被 如 何 获得 的 记录 。 这 些 信 息 对 于 软件 的 维护 是 有 帮助 的 ， 因 为 它 指明 了 
软件 为 何 要 这 样 实现 ， 同 时 这 些 信 息 也 降低 了 这 样 一 种 可 能 性 ， 即 在 维护 阶段 所 作出 的 变更 会 
破坏 系统 的 完整 性 。 

技术 文档 (technical documentation〉 用 来 描述 软件 系统 应 如 何 安装 和 服务 (如 调整 操作 参 
数 、 安 装 更 新 以 及 将 出 现 的 问题 反馈 给 软件 开发 人 员 )。 软件 的 技术 文档 与 汽车 工业 中 提供 给 汽 
车 修理 工 的 文档 类 似 。 这 种 文档 不 讨论 汽车 是 怎样 设计 和 构造 的 (这 类 似 于 软件 的 系统 文档 )， 
也 不 解释 如 何 驾 驶 汽车 和 操作 汽车 加 热 /制冷 系统 〈 这 类 似 于 软件 的 用 户 文档 )， 而 是 用 来 描述 
如 何 维护 汽车 的 配件 ， 例 如 ， 如 何 替 换 变速 器 ， 或 者 如 何 解决 断断续续 的 电气 方面 的 问题 。 

在 PC 领域 里 ， 软 件 的 技术 文档 和 用 户 文档 之 间 的 差异 就 变 得 比较 模糊 了 ， 这 是 因为 用 户 通 
常 自己 安装 和 维护 软件 。 然 而 ， 在 多 用 户 环境 中 ， 这 种 差异 就 更 明显 了 ， 因 为 这 种 情况 下 ， 技 
术 文档 是 提供 给 系统 管理 员 使 用 的 。 系 统管 理 员 要 负责 其 管辖 范围 内 所 有 软件 的 维护 ， 人 允许 用 
户 将 软件 包 作 为 抽象 工具 访问 。 


问题 与 练习 JJ | 

1. 软件 可 以 以 哪些 形式 文档 化 ? 

2. 系统 文档 应 在 软件 生命 周期 的 哪个 〈 或 哪些 ) 阶段 进行 准备 ? 
3. 程序 和 它 的 文档 相 比 ， 哪 个 更 重要 ? 


oa eve 一 一 一 一 一 一 一- 一 一 一 一 -~ 一 …~-- -一 一 


7.8 人 机 界面 


回顾 一 下 7.2 节 ， 其 中 讲 到 需求 分 析 阶 段 的 一 项 任务 是 定义 要 开发 的 软件 系统 将 如 何 与 它 的 
环境 进行 交互 。 本 节 我 们 将 考虑 与 这 个 交互 相关 的 主题 ， 那 就 是 当 它 涉及 与 人 通信 时 的 情况 ， 
这 是 一 个 意义 深远 的 主题 。 毕 竞 ， 人 类 应 该 允许 用 户 把 软件 系统 当 作 一 个 抽象 工具 来 使 用 。 这 
个 工具 应 该 易于 使 用 ， 能 最 小 化 〈 理 想 情 况 下 消灭 ) 用户 与 系统 间 的 通信 错误 。 这 意味 着 系统 
界面 的 设计 应 方便 用 户 的 使 用 ， 而 不 仅 是 作为 软件 系统 的 权宜 之 计 。 

良好 的 界面 设计 非常 重要 ， 因 为 与 系统 的 其 他 特征 相 比 ， 系 统 界面 更 容易 给 用 户 留 下 深刻 的 
印象 。 毕 竟 ， 用 户 往往 会 从 系统 的 可 用 性 角度 来 审视 一 个 系统 ， 而 不 是 从 它 如 何 巧妙 地 执行 其 内 部 
任务 这 个 角度 。 从 用 户 的 视角 来 说 ， 他 们 可 能 会 根据 系统 界面 在 两 个 具有 竞争 性 的 系统 之 间作 出 选 
择 。 因 此 ， 系 统 界面 的 设计 可 能 会 成 为 判定 一 个 软件 工程 项 目 是 否 成 功 的 最 终 决 定 因素 。 
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由 于 这 些 原因 ， 人 机 界面 在 软件 开发 项 目的 需求 分 析 阶 段 已 经 成 为 一 个 很 重要 的 关注 点 ， 
并 且 是 软件 工程 的 一 个 不 断 成 长 的 子 领域 。 事 实 上 ， 有 些 人 认为 人 机 界面 的 研究 是 一 个 完全 独 
立 的 领域 。 

智能 手机 界面 便 得 益 于 这 一 领域 的 研究 。 为 了 能 够 实现 一 种 方便 的 袖珍 设备 ， 传 统 人 机 界 
面 的 元 素 〈 标 准 尺寸 的 键盘 、 鼠 标 、 滚 动 条 、 菜 单 ) 已 被 新 的 方式 所 取代 ; 新 方式 的 例子 包括 
在 触摸 屏 上 操作 的 手势 、 语 音 命令 、 具 有 高 级 的 单词 和 短语 自动 输入 功能 的 虚拟 键盘 。 尽 管 这 
标志 着 重大 的 进展 ， 但 大 多 数 智能 手机 用 户 认为 进一步 创新 的 空间 还 很 大 

对 人 机 界面 设计 的 研究 主要 来 自 于 称 为 人 机 工程 学 (ergonomics〉 和 知行 学 (cognetics) 的 
工程 领域 。 人 机 工程 学 研究 的 是 与 人 类 身体 能 力 相 协调 的 系统 的 设计 ， 知 行 学 研究 的 是 与 人 类 
精神 能 力 相 协调 的 系统 的 设计 。 这 两 个 学 科 中 ， 人 机 工程 学 更 好 理解 一 些 ， 主 要 是 因为 人 类 已 
经 跟 机 器 打 了 几 个 世纪 的 交道 。 这 些 例子 有 : 古代 工具 、 武 器 和 运输 系统 。 这 些 历史 大 部 分 是 
不 证 自明 的 ， 但 是 有 时 人 体 工 程 学 的 应 用 与 直觉 是 相反 的 。 一 个 经 常 被 提 到 的 例子 就 是 打字 机 
键盘 〈 现 在 已 经 衍生 为 计算 机 键盘 ) 的 设计 ， 其 中 键 被 有 意 排列 ， 以 降低 打字 员 的 速度 ， 这 样 
早期 机 器 上 使 用 的 分 层 机 械 系 统 就 不 会 卡 住 。 

相反 ， 与 机 器 的 精神 交互 是 一 个 相对 较 新 的 现象 ， 因 此 ， 正 是 知行 学 为 富有 成 效 的 研究 和 
启发 性 的 见解 提供 了 更 大 的 可 能 性 。 通 常 这 些 研究 成 果 更 具有 精妙 之 处 。 例 如 ， 从 表面 上 看 人 
类 的 良好 习惯 有 助 于 提高 效率 ， 但 有 些 习惯 也 会 导致 一 些 错误 ， 即 使 界面 设计 本 意 上 是 要 解决 
问题 的 。 考 虑 一 下 用 户 要 求 一 个 典型 操作 系统 删除 一 个 文件 的 过 程 ， 为 了 防止 误 删 ， 大 部 分 界 
面 都 会 要 求 用 户 确 认 一 个 请 求 ， 也 许 是 通过 一 个 消息 确认 ， 如 “你 真 的 想 删除 这 个 文件 吗 ? ?” 
乍 一 看 ， 这 个 确认 信息 好 像 解决 了 误 删 的 问题 ， 但 是 使 用 这 个 系统 一 段 时 间 后 ， 用 户 会 养 成 习 
惯 ， 自 动 回答 “是 ” 这样 ， 这 个 删除 文件 的 任务 就 从 包含 删除 命令 和 对 问题 思考 后 的 响应 的 两 
步 过 程 ， 变 成 了 “删除 一 是 ”的 一 步 处 理 过程 ， 这 就 意味 着 当 用 户 意 识 到 提交 了 错误 的 删除 要 
求 时 ， 这 个 请 求 其 实 已 经 被 确认 ， 文 件 也 已 经 被 删除 。 

当 人 们 需要 使 用 几 个 应 用 软件 包 时 ， 习 惯 的 形成 也 可 能 会 带 来 问题 。 这 些 软件 包 的 界面 可 
能 相似 ， 但 还 是 有 些 不 同 的 。 相 似 的 用 户 操作 可 能 会 导致 不 同 的 系统 响应 ， 或 类 似 的 系统 响应 
可 能 需要 不 同 的 用 户 操 作 。 在 这 种 情况 下 ， 在 某 种 应 用 软件 上 养 成 的 操作 习惯 可 能 会 在 其 他 应 
用 软件 上 导致 错误 的 发 生 。 

另外 一 个 与 人 机 界面 设计 研究 有 关 的 人 类 特质 就 是 人 类 注意 力 的 狭隘 性 ， 也 就 是 当 集 中 度 
增加 时 ， 人 类 注意 力 往 往 变 得 更 加 专注 。 随 着 人 类 越 来 越 专注 于 手头 上 的 工作 ， 打 破 这 种 专注 
也 越 来 越 困 难 。1972 年 ， 一 架 商 务 飞 机 因为 飞行 员 太 过 专注 于 起 落架 问题 〈 实 际 上 ， 是 在 改变 
起 落架 指示 灯 的 过 程 中 ), 虽然 驾驶 舱 里 的 警报 一 直 在 响 , 但 飞机 还 是 笔直 地 撞 向 了 地 面 ,造成 
了 空难 。 

个 人 计算 机 的 界面 中 经 常会 出 现 一 些小 状况 。 例 如 ， 大 多 数 键盘 提供 “大 写 锁定 ”(Caps 
Lock) 灯 ， 用 于 指示 键盘 是 否 处 在 “大 写 锁定 ”模式 下 〈 即 “大 写 锁 定 ” 刍 已 被 按 了 )。 但 是 ， 
如 果 有 人 不 小 心 按 了 大 写 锁定 键 , 那么 直到 奇异 的 字符 出 现在 屏幕 上 , 他 才 会 注意 到 灯 的 状态 。 
即使 如 此 ， 用 户 经 常 依然 会 迷茫 一 会 儿 才 会 发 现 问题 的 原因 。 从 某 种 意义 上 来 说 ， 用 户 看 不 到 
大 写 灯 的 变化 是 很 正常 的 ， 因 为 键盘 的 指示 灯 不 在 用 户 的 视线 范围 之 内 。 但 是 ， 通 常用 户 也 不 
能 注意 到 直接 放置 在 他 们 视线 中 的 指示 灯 。 例 如 ， 用 户 会 专注 于 他 们 的 任务 而 无 法 发 现 显示 屏 
上 光标 形状 的 变化 ， 即 使 观察 光标 是 他 们 的 任务 之 一 。 

还 有 另外 一 个 在 界面 设计 阶段 必须 预先 考虑 的 人 类 特质 ， 即 并 行 处 理 多 个 事情 时 有 限 的 思 
考 能 力 。 在 1956 年 《心理 学 评论 》(Psychological Review) 的 一 篇 文章 中 ，George A. Miller 的 研 
究 表 明 ， 人 类 大 脑 在 同一 时 间 最 多 处 理 7 个 细节 问题 。 因 此 ， 重 要 的 是 界面 要 设计 成 这 样 的 : 当 
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需要 决定 时 ， 界 面 上 要 呈现 所 有 相关 的 信息 ， 而 不 应 依赖 人 类 用 户 的 记忆 。 特 别 地 ， 若 要 求人 
类 记 住 先前 屏幕 图 像 中 的 精确 细节 ， 这 就 是 很 糟糕 的 设计 。 更 进一步 地 ， 如 果 界 面 需 要 用 户 在 
屏幕 图 像 间 进行 大 量 导 航 ， 用 户 会 变 得 很 迷惑 。 因 此 ， 屏 幕 图 像 的 内 容 和 安排 成 为 了 一 个 重要 
的 设计 问题 。 

尽管 人 机 工程 学 和 知行 学 的 应 用 使 得 人 机 界面 设计 折射 出 独特 的 韵味 ， 但 这 个 领域 还 是 包 
含 着 软件 工程 中 很 多 更 加 传统 的 主题 。 特 别 地 ， 度 量 搜 索 在 界面 设计 领域 和 更 传统 的 软件 工程 
领域 中 具有 同样 的 重要 性 。 界 面 可 以 度量 的 特性 包括 了 解 一 个 界面 所 需 的 时 间 、 在 界面 上 完成 
任务 所 需 的 时 间 、 用 户 界 面 出 错 的 概率 、 一 段 时 间 不 用 后 用 户 使 用 界面 的 熟练 程度 ， 甚 至 是 一 
些 诸如 用 户 对 界面 喜好 程度 的 主观 特性 。 

GOMS“〈 与 “Toms” 押 韵 ) 模型 最 初 是 在 1954 年 提出 的 ， 它 是 人 机 界面 设计 领域 里 度量 搜 
索 的 范例 。 这 个 模型 的 基础 方法 学 是 依据 用 户 的 目标 (如 删除 文本 中 的 某 个 字 )、 操 作 (如 单 击 
鼠标 按键 )、 方 法 〈 如 双击 鼠标 按键 ， 然 后 按 下 删除 键 ) 和 选择 规则 (实现 相同 目标 的 两 种 方法 
间 的 选择 ) 来 分 析 任 务 的 。 实 际 上 , 这 就 是 GOMS 缩 写 的 起 源 一 goal (目标 )、operator (操作 )、 
method 〈 方 法 ) 以 及 selection rule (选择 规则 )。 简 言 之 ，GOMS 就 是 一 种 把 用 户 使 用 一 个 界面 
的 动作 分 析 成 基本 步骤 序列 〈 按 键 、 移 动 鼠 标 、 作 出 决定 ) 的 方法 学 。 每 个 基本 步骤 的 性 能 都 
被 赋予 一 个 精确 的 时 间 段 ， 这 样 通过 把 任务 中 赋予 每 个 步骤 的 时 间 相 加 ， 从 完成 相似 任务 每 个 
界面 所 需 的 时 间 这 个 角度 来 看 ，GMOS 提 供 了 一 种 比较 不 同 的 提议 界面 的 方法 。 

理解 类 似 于 GMOS 的 系统 的 技术 细节 不 是 我 们 当前 的 研究 目的 , 我 们 示例 的 要 点 是 , GOMS 
是 以 人 类 行为 〈 移 动手 、 作 出 决定 等 ) 特性 为 基础 的 。 事 实 上 ，GMOS 的 发 展 起 初 被 认为 是 心 
理学 中 的 主题 。 因 此 ，GMOS 重 新 强调 了 人 类 特性 在 人 机 界面 设计 领域 中 ， 以 及 在 那些 从 传统 
软件 工程 里 延伸 出 来 的 主题 中 所 起 的 作用 。 

在 可 预见 的 未 来 ， 人 机 界面 设计 肯定 是 一 个 活跃 的 研究 领域 。 处 理 当 今 GUI 的 许多 问题 依 
然 没 有 得 到 解决 ， 天 天 局 训 问 是 几 春 于 三 级 儿 面 《这 位 的 措 面 到 六 中 至 出 现 ) 的 使 用 中 。 实 际 
上 ， 因 为 这 些 界 面 承诺 结合 语音 和 与 三 维 视觉 的 触摸 交流 ， 所 以 潜在 问题 的 范围 是 巨大 的 。 


问题 与 练习 


1. a. 说 出 人 机 界面 设计 领域 中 人 机 工程 学 的 一 个 应 用 。 
b. 说 出 人 机 界面 设计 领域 中 知行 学 的 一 个 应 用 。 

2. 对 比 智能 手机 与 台式 机 的 人 机 界面 ， 一 个 显著 的 区 别 便 是 滚动 显示 区 域 所 运用 的 技术 。 在 台式 机 上 ， 
滚动 通常 通过 用 鼠标 拖 忠 显示 区 域 下 方 或 右 侧 的 滚动 条 或 者 使 用 鼠标 内 置 的 滚轮 来 实现 , 而 智能 手机 
通常 不 使 用 滚动 条 。( 就 算 使 用 ， 它 们 通常 也 显示 为 细 线 ， 以 表明 当前 哪 一 部 分 可 见 。) 智能 手机 界面 
上 的 滚动 是 通过 在 显示 屏 上 进行 的 滑动 触摸 手势 实现 的 。 

，a. 根据 人 机 工程 学 ， 可 以 提出 什么 论据 来 支持 这 一 区 别 ? 

。 b. 根据 知行 学 ， 可 以 提出 什么 论据 来 支持 这 一 区 别 ? 

3. 人 机 界面 设计 领域 与 更 传统 的 软件 工程 领域 有 什么 不 同 ? 

4. 说 出 在 设计 人 机 界面 时 要 考虑 的 人 类 的 3 个 特性 。 


7.9 ”软件 所 有 权 和 责任 


大 多 数 人 都 会 同意 这 样 一 个 观点 , 即 公司 或 个 人 投资 开发 高 质量 的 软件 , 都 可 以 从 中 获 利 ， 
得 到 回报 ， 否 则 就 很 可 能 没有 人 愿意 从 事 开 发 社会 所 需 的 软件 的 工作 了 。 简 言 之 ， 软 件 开发 者 
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需要 对 他 们 生产 的 软件 拥有 一 定 的 所 有 权 。 

提供 这 种 所 有 权 的 法 律 措施 归 类 于 知识 产权 法 ， 其 中 许多 依据 的 都 是 版 权 法 和 专利 法 的 既 
定 原则 。 实际 上 , 版 权 和 专利 的 目的 是 允许 产品 的 开发 者 在 向 公众 发 布 产 品 〈 或 其 部 分 ) 时 ， 
其 所 有 权 得 到 保护 。 因 此 ， 一 个 产品 的 开发 人 员 (无 论 是 个 人 还 是 公司 ) 声明 其 对 该 产品 的 
所 有 权 的 方式 有 : 在 其 创作 的 所 有 作品 中 加 入 版 权 声 明 ; 在 最 终 产 品 中 的 显著 位 置 加 入 需求 
规范 说 明 、 设 计 文档 、 源 代码 、 测 试 计划 。 版 权 声 明 清 晰 地 确定 了 所 有 权 、 有 权 使 用 该 产品 
的 人 以 及 其 他 限制 。 此 外 ， 开 发 人 员 的 权利 在 软件 许可 (software license) 中 是 用 法 律 术 语 正式 
表述 的 。 

软件 许可 是 软件 所 有 者 与 软件 产品 用 户 之 间 的 一 份 法 律 协议 , 它 为 用 户 使 用 这 一 产品 
授予 一 定 的 使 用 许可 , 但 不 允许 转让 知识 产权 。 这些 协议 非常 详细 地 解释 了 各 双方 的 权利 和 
义务 。 因 此 ,在 安装 和 使 用 某 一 软件 产品 之 前 , 仔细 阅读 和 理解 软件 许可 中 的 条 款 是 非常 重 
要 的 。 

尽管 版 权 和 软件 许可 协议 为 禁止 直接 复制 和 非 授权 使 用 软件 提供 了 法 律 保护 ， 但 它们 通常 
不 足以 禁止 男 一 方 独立 开发 与 该 产品 功能 几 近 相同 的 软件 产品 。 令 人 遗憾 的 是 ， 多 年 来 很 多 真 
正 具有 创新 性 的 软件 产品 的 开发 人 员 却 无 法 从 他 自己 的 发 明 中 充分 获 利 (其 中 两 个 著名 的 例子 
便 是 电子 制 表 软 件 和 Web 浏 览 器 )。 在 大 多 数 情况 下 ， 往 往 是 另 一 家 公司 成 功 地 开发 了 具有 竞争 
力 的 产品 ， 并 占据 了 有 具有 绝对 优势 的 市 场 份额 。 就 这 一 方面 来 说 ， 阻 止 竞争 对 手 侵扰 的 一 个 法 
律 途径 就 是 专利 法 。 

专利 法 的 建立 是 为 允许 发 明 者 从 他 的 发 明 中 获得 商业 上 的 利益 。 为 了 获得 专利 ， 发 明 者 必 
须 透 露 发 明 的 细节 ， 并 说 明 这 是 新 的 、 有 用 的 ， 不 是 具有 类 似 背 景 的 其 他 人 能 轻而易举 做 到 的 
(对 于 软件 来 说 ， 这 一 需求 非常 具有 挑战 性 )。 如 果 一 个 专利 被 授权 ， 那 么 在 一 段 有 限 的 时 期 内 
发 明 者 就 被 赋予 了 这 样 的 权力 : 防止 其 他 人 人 制造、 使用、 销售 或 引入 专利 。 这 段 时 间 一 般 是 专 
利 申请 被 提出 之 日 起 的 20 年 。 

采用 专利 的 一 个 问题 是 ， 获 取 专 利 是 一 个 昂贵 的 、 费 时 的 过 程 ， 通 常 要 历时 几 年 。 在 这 段 
时 间 内 ， 软 件 产品 可 能 已 经 被 淘汰 了 ， 而 直到 专利 被 授权 ， 申 请 者 手中 只 有 靠不住 的 权限 去 阻 
止 别人 盗用 其 产品 。 

在 软件 工程 过 程 中 ， 明 确 版 权 、 软 件 许 可 和 专利 是 极其 重要 的 。 在 开发 某 一 软件 产品 时 ， 
软件 工程 师 通常 会 选择 集成 取 自 其 他 产品 的 软件 ， 它 可 能 是 一 个 完整 的 产品 、 一 部 分 组 件 ， 也 
可 能 是 通过 因特网 下 载 的 一 部 分 源 代 码 。 然 而 ， 如 果 在 此 过 程 中 未 能 尊重 知识 产权 ， 则 将 可 能 
导致 巨大 的 损失 和 严重 的 后 果 。 例 如 ，2004 年 ， 一 个 不 太 出 名 的 公司 一 一 NPT 有 限 公 司 一 一 成 
功 地 赢得 了 一 场 法 律 诉 讼 ， 它 控告 Research In Motion (RIM， 黑 莹 智能 手机 制造 商 ) 公司 在 邮 
件 系统 中 侵犯 了 它 的 一 些 关 键 技术 的 专利 权 。 这 一 诉讼 的 判决 结果 包括 暂停 RIM 向 美国 所 有 黑 
莓 用 户 提供 电子 邮件 服务 的 禁令 ! 最 终 ，RIM 与 NPT 达 成 协议 并 支付 给 NPT 总 共 6.125 亿 美元 ， 
从 而 避免 了 关 停 的 命运 。 

最 后 ， 我 们 应 当 讨论 责任 的 问题 。 软 件 开 发 者 为 了 保护 自己 免 于 承担 责任 ， 通 常会 在 其 产 
品 上 附带 免责 声明 ， 用 以 说 明 其 责任 的 限制 。 诸 如 “ 因 使 用 本 软件 所 造成 的 任何 损失 ， 本 公司 
概 不 负责 ”这 样 的 声明 比较 和 常见。 然而， 如 果 原 告 能 够 举 出 被 告 的 疏忽 之 处 ， 法 庭 很 少 会 认可 
这 类 声明 。 所 以 ， 责 任 案件 倾向 于 关注 被 告 对 所 生产 的 产品 是 否 给 予 了 相应 的 关照 程度 。 一 个 
在 开发 字 处 理 系统 的 情况 下 认为 可 以 接受 的 关照 程度 ， 如 果 放 在 核反应 堆 的 控制 软件 的 开发 
上 ， 就 可 能 被 认为 是 一 种 疏忽 。 因 此 ， 对 软件 责任 声明 的 最 好 防护 之 一 就 是 ， 在 软件 的 开发 
过 程 中 ， 运 用 合理 的 软件 工程 准则 ， 采 用 与 软件 应 用 相 适 应 的 关照 程度 ， 产 生 并 维护 验证 这 
些 努 力 的 记录 。 
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问题 与 练习 
1. 在 需求 规格 说 明 、 设 计 文 档 、 源 代码 和 最 终 产 品 中 ， 版 权 声 明 的 意义 是 什么 ? 
2. 版 权 法 、 专 利 法， 这 些 法 规 的 制定 对 社会 有 何 益处 ? 
3. 免责 声明 中 的 什么 内 容 将 不 会 被 法 庭 认可 ? 








复习 题 





〈 带 #+ 的 题目 涉及 选 学 章节 的 内 容 。) 
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. 举 出 一 个 例子 ， 说 明 软 件 开发 时 所 做 的 努力 


是 如 何在 日 后 的 软件 维护 中 得 到 回报 的 。 


: 什么 是 演化 式 原型 开发 ? 
. 试 解释 缺少 度量 某 些 软件 特性 的 度量 学 是 如 


何 影响 软件 工程 学 科 的 。 


. 你 是 否认 为 度量 软件 系统 复杂 性 的 度量 标准 


是 积累 的 ? 积累 的 意思 是 : 整个 系统 的 复杂 性 
是 其 各 部 分 的 复杂 性 之 和 。 请 解释 你 的 答案 。 


. 你 是 否认 为 度量 软件 系统 复杂 性 的 度量 标准 


是 可 交换 的 ? 可 交换 的 意思 是 : 如 果 系 统 最 初 
开发 了 X 特 性 , 后 来 加 入 了 Y 特 性 , 或 者 是 如 果 
原先 开发 了 Y 特 性 , 后 来 增加 了 X 特 性 , 那么 整 
个 系统 的 复杂 性 是 相同 的 。 请 解释 你 的 答案 。 


. 软件 工程 是 如 何 区 别 于 诸如 电子 、 机 械 工程 


之 类 的 传统 工程 领域 的 ? 
a. 给 出 软件 开发 中 采用 传统 瀑布 模型 的 缺点 。 
b. 给 出 软件 开发 中 采用 传统 瀑布 模型 的 优点 。 


. 开源 开发 是 一 个 自 顶 向 下 或 者 自 底 向 上 的 方 


法 学 吗 ? 请 解释 你 的 答案 。 


. 试 描述 为 何 使 用 常量 代替 字面 量 能 简化 软件 


维护 。 


. 耦合 和 内 聚 的 区 别 是 什么 ? 哪个 应 该 最 小 


化 ? 哪个 应 该 最 大 化 ? 为 什么 ? 


. 从 日 常生 活 中 选取 一 个 对 象 , 依据 功能 内 聚 或 


逻辑 内 聚 来 分 析 其 组 成 部 分 。 


. 试 将 由 一 条 简单 的 goto 语 句 所 造成 的 两 个 程 


序 段 间 的 耦合 与 由 函数 调用 所 引起 的 耦合 进 
行 比较 。 


. 在 第 6 章 中 我 们 已 经 知道 ， 参 数 可 以 通过 按 值 


传递 或 按 引 用 传递 这 两 种 方式 传递 给 函数 。 哪 
一 种 提供 了 更 为 复杂 的 数据 耦合 形式 ? 请 解 
释 你 的 答案 。 


. 如 果 一 个 大 型 的 软件 系统 中 的 数据 元 素 都 设 


计 成 全 局 数据 ， 那 么 在 维护 阶段 中 可 能 会 出 现 
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什么 问题 ? 

在 面向 对 象 程 序 中 ， 声 明 一 个 实例 变量 是 公 
有 的 或 是 私有 的 对 数据 耦合 意味 着 什么 ?对 
于 声明 实例 变量 为 私有 的 这 一 偏好 , 其 背后 的 
基本 原理 是 什么 ? 

举 出 一 个 涉及 并 行 处 理 环 境 下 发 生 的 数据 耦 
合 的 问题 。 


. 按 下 面 的 结构 图 回答 下 列 问 题 : 





a. 模块 Y 把 控制 返回 到 哪个 模块 ? 

b. 模块 Z 把 控制 返回 到 哪个 模块 ? 

c. 模块 W 和 模块 X 是 通过 控制 耦合 链接 起 来 
的 吗 ? 

d. 模块 W 和 模块 X 是 通过 数据 耦合 链接 起 来 
的 吗 ? 

e. 哪些 数据 是 由 模块 W 和 模块 Y 共 享 的 ? 

f. 模块 W 和 模块 Z 是 以 什么 方式 相关 联 的 ? 


. 用 一 个 结构 图 来 表示 为 小 商店 (也 许 是 在 人 流 


量 较 大 的 社区 开 的 一 家 私人 古董 店 ) 开 发 的 一 
个 简单 库存 / 账 务 系 统 的 过 程 结构 。 

请 问 , 出 于 销售 税法 的 变动 ， 你 必须 要 修 
改 系 统 中 的 哪些 模块 ? 如 果 你 决定 要 维护 一 
个 老 顾客 的 记录 , 以 便 能 给 以 前 的 顾客 邮寄 广 
告 ， 那 么 需要 对 哪些 模块 进行 修改 ? 


. 使 用 类 图 , 为 上 题 设 计 一 个 面向 对 象 的 解决 


办 法 。 
画 出 一 个 简单 的 类 图 ,表示 杂志 出 版 商 、 杂 志 
和 订阅 者 彼此 之 间 的 关系 。 只 要 在 表示 每 个 类 
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的 相应 矩形 框 中 描述 类 名 即 可 。 


. 什么 是 UML? 它 是 用 来 做 什么 的 ? 请 详细 解 


释 与 “M” 这 一 字母 对 应 的 词 。 

画 出 一 个 简单 的 用 例 图 ， 描 述 图 书馆 的 顾客 使 
用 图 书馆 的 方式 。 

画 出 一 个 序列 图 ， 表 示 当 公用 事业 公司 给 客户 
发 送 账 单 时 ， 继 而 发 生 的 交互 序列 。 

画 出 一 个 简单 的 数据 流 图 , 描述 当 一 个 交易 
完成 时 ， 自 动 库存 系统 里 出 现 的 数据 流 。 


. 将 类 图 所 表示 的 信息 与 序列 图 所 表示 的 信息 


进行 比较 。 
说 明 一 对 多 关系 与 多 对 多 关系 有 何不 同 ? 


, 举 出 一 个 本 章 中 没有 提 到 的 一 对 多 关系 的 例 


子 。 举 出 一 个 本 章 中 没有 提 到 的 多 对 多 关系 的 
例子 。 

基于 图 7-10 中 的 信息 , 想象 一 下 在 看 望 病人 的 
过 程 中 医生 和 病人 间 可 能 发 生 的 交互 序列 。 画 
出 一 个 表示 这 个 序列 的 序列 图 。 

画 出 一 个 类 图 , 表示 饭店 里 服务 生 和 顾客 之 间 
的 关系 。 

画 出 一 个 类 图 ， 表 示 杂 志 、 杂 志 出 版 商 和 订阅 
者 彼此 之 间 的 关系 。 并 提供 每 个 类 的 实例 变量 
和 方法 。 


. 扩展 图 7-5 中 的 序列 图 , 显示 这 样 的 交互 序列 : 


PlayerA 成 功 地 返回 了 PlayerB 的 球 ， 但 
PlayerB 未 能 成 功 返 回 这 个 截击 球 。 


. 基于 下 面 的 类 图 回答 下 列 问题 ， 类 图 表示 的 


是 工具 、 工 具 的 用 户 以 及 工具 的 生产 厂商 彼 
此 之 间 的 关联 。 





a. 工具 、 用 户 和 厂商 分 别 是 由 哪个 类 (X、Y 
和 Z) 表示 的 ? 验证 你 的 答案 。 

b. 一 个 工具 能 被 1 个 以 上 的 用 户 使 用 吗 ? 

一 个 工具 能 被 1 个 以 上 的 厂商 制造 吗 ? 

是 否 每 个 用 户 都 要 使 用 由 多 个 厂商 制造 的 多 个 

工具 ? 

根据 下 面 的 各 种 情况 ， 判 断 所 述 的 活动 是 与 

序列 图 有 关 、 用 例 图 有 关 ， 还 是 与 类 图 有 关 。 

a. 表示 用 户 将 与 系统 交互 的 方式 。 

b. 表示 系统 中 两 个 类 之 间 的 关系 。 


Pr 总 





c. 表示 完成 某 一 任务 时 对 象 的 交互 方式 。 


34. 基于 下 面 的 序列 图 ， 回 答 下列 问 题 。 





35; 


Un 


3 


3 


38. 


oo 


39. 


4 


41. 
42. 


ID 一 


4 


ULD 


45. 


人 


Ea 


舍 





a. 什么 类 含有 名 为 ww 的 方法 ? 

b. 什么 类 含有 名 为 xx 的 方法 ? 

c. 在 序列 中 ，Z 类 型 的 对 象 会 与 Y 类 型 的 对 象 
直接 通信 吗 ? 

画 出 一 个 序列 图 ， 表 明 对 象 A 调 用 对 象 B 中 的 

方法 bb，B 执 行 请 求 的 动作 并 返回 控制 给 A， 

然后 A 再 调用 对 象 B 中 的 方法 cc。 

扩展 对 前 面 问题 的 解决 方法 , 表明 只 有 当 变 量 

“continue ”为 真 时 ，A 才 能 调用 方法 bb， 在 B 

返回 控制 后 ， 只 要 “continue” 继 续 为 真 ，A 

就 可 以 继续 调用 bb。 

画 出 一 个 类 图 ， 描 述 这 样 一 个 事实 ， 即 Truck 

(卡车 ) 类 和 Automobile (小 汽车 ) 类 都 是 

Vehicle〈 汽 车 ) 类 的 泛 化 。 

基于 图 7-12，SurgicalRecord 类 型 的 对 象 中 会 

包含 什么 额外 实例 变量 ? OfficeVisitRecord 

类 型 的 呢 ? 

解释 为 什么 继承 并 不 总 是 实现 类 泛 化 的 最 佳 

Ns 

举 出 软件 工程 领域 以 外 的 一 些 设计 模式 。 

总 结 设计 模式 在 软件 工程 中 的 作用 。 

在 什么 程度 上 来 说 , 一 个 典型 的 高 级 程序 设计 

语言 中 的 控制 结构 (如 if-else、while 等 ) 

就 是 小 型 的 设计 模式 ? 


.以 下 情况 中 ， 哪 个 涉及 了 帕 累 托 法 则 ? 解释 你 


的 答案 。 

a. 一 粒 老鼠 屎 搞 坏 一 锅 粥 。 

b. 每 个 电台 都 集中 于 一 种 特定 的 形式 ， 如 摇 
滚 乐 、 古 典 音 乐 或 谈话 。 

c. 在 选举 活动 中 ， 候 选 人 非常 明智 地 将 其 重 
点 放 在 之 前 投 他 们 票 的 那 部 分 选民 上 。 
软件 工程 师 希 望 大 型 软件 系统 在 错误 的 内 容 
上 是 同 种 类 型 的 , 还 是 不 同类 型 的 ? 解释 你 的 

答案 。 
黑 盒 测试 与 白 盒 测 试 的 区 别 是 什么 ? 
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46. 


47. 


48. 


49. 
50. 
31, 


-re 一 -we 一 -一 -一 一 一 -一 一 -一 -一 一 一 一 
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试 举 出 一 些 在 软件 工程 以 外 的 领域 中 发 生 的 
与 黑 盒 测 试 和 和 白 盒 测试 类 似 的 事件 。 

开源 开发 与 beta 测 试 有 何 区 别 ? 〈 考 虑 白 盒 测 
试 和 黑 盒 测试 。) 

假定 在 一 个 大 型 系统 快要 完成 最 后 的 测试 之 
前 ， 故 意 放 入 100 个 错误 。 此 外 ， 还 假定 在 最 
后 的 测试 期 间 发 现 并 纠正 了 200 个 错误 ， 而 其 
中 的 50 个 错误 属于 故意 放 入 系统 中 的 。 请 问 ， 
如 果 接 下 来 那些 剩 下 的 50 个 已 知 错误 也 被 纠 
正 了 ,那么 你 估计 系统 中 还 有 多 少 个 没有 发 现 
的 错误 ? 为 什么 ? 

什么 是 GOMS? 

什么 是 人 机 工程 学 ? 什么 是 知行 学 ? 

对 比 智能 手机 与 台式 机 的 人 机 交互 界面 , 一 个 
区 别 就 在 于 改变 显示 屏 上 图 像 比例 以 得 到 或 


社会 问题 


5 


2 


多 或 少 细节 (此 过 程 称 为 “缩放 ”) 的 技术 。 

台式 机 上 ,缩放 通常 通过 拖 动 一 个 独立 于 显 
示 区 的 滑 块 来 实现 ,或 者 通过 菜单 或 工具 栏 选 
项 实现 。 在 智能 手机 上 ， 缩 放 是 这 样 实现 的 : 
用 大 拇指 和 食指 同时 触摸 显示 屏 , 然后 改变 两 
个 触摸 点 间 的 距离 ( 即 实现 “放大 ”功能 的 “ 双 
指 触 击 - 展 开 ” 过 程 ， 或 者 实现 “缩小 ”功能 
的 “ 双 指 触 击 -收缩 ”过 程 )。 

a. 根据 人 机 工程 学 , 可 以 提出 什么 论据 来 支持 
这 一 区 别 ? 
b. 根据 知行 学 ， 
一 区 别 ? 
在 什么 情况 下 ,传统 的 版 权 法 无 法 保护 软件 开 

发 者 的 投资 ? 


可 以 提出 什么 论据 来 支持 这 


53. 在 什么 情况 下 ， 软 件 开发 者 不 能 成 功 获得 专利 ? 





希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 道德 、 社 会 和 法 律 问题 。 回 答 出 这 
些 问 题 还 不 够 ， 还 应 该 考虑 为 什么 这 样 回 答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 


1. a. 


分 析 员 玛丽 被 分 配 了 一 个 任务 一 一 要 实现 一 个 系统 。 通 过 该 系统 可 以 将 医疗 档案 存放 
在 与 大 型 网 络 相 连接 的 计算 机 上 。 依 据 她 的 观点 来 看 ， 系 统 安全 性 方面 的 设计 存在 着 
缺陷 ， 但 是 由 于 公司 财力 方面 的 原因 ， 她 所 提出 的 想法 被 否决 了 ， 而 且 公司 要 求 使 用 
她 认为 不 太 合 适 的 安全 系统 来 继续 该 项 目 。 这 种 情况 下 ， 她 该 怎么 办 ? 为 什么 ? 


. 假设 分 析 员 玛丽 按照 吟 只 实 现 了 该 系统 ， 而 现在 她 发 现 有 未 经 授权 的 人 在 检索 医疗 档 


案 。 这 时 她 该 怎么 办 ? 对 于 这 样 一 种 侵犯 安全 的 情况 ， 她 将 负 多 大 责任 ? 


. 假设 分 析 员 玛丽 没有 听从 老板 的 安排 ， 拒 绝 继续 开发 这 个 系统 ， 并 且 义 无 反 顾 地 将 设 


计 缺 陷 公 布 于 众 ， 结 果 导 致 公司 的 财务 紧张 ， 许 多 无 辜 的 员工 失去 工作 。 分 析 员 玛丽 
的 行为 对 吗 ? 如 果 玛 丽 仅仅 是 整个 设计 组 的 一 名 成 员 , 她 并 不 了 解 公司 正在 花费 大 的 
精力 在 别 的 地 方 开 发 一 套 有 效 的 安全 系统 ， 而 这 套 系统 将 会 用 在 玛丽 正在 开发 的 系统 
上 , 那么 又 会 怎么 样 ? 这 种 情况 是 如 何 改变 你 对 玛丽 行为 的 判断 的 ? (需要 注意 的 是 ， 
玛丽 对 这 种 情况 的 观点 和 以 前 一 样 。) 


. 当 一 个 大 型 软件 系统 由 许多 人 一 起 开发 时 ， 如 何 分 配 责任 ? 是否 有 一 种 层次 型 的 责任 ? 


是 否 有 不 同 程度 的 责任 ? 


3. 我 们 知道 ， 大 型 的 复杂 软件 系统 通常 是 许多 成 员 一 起 开发 的 ， 其 中 很 少 有 人 能 够 对 整个 
项 目 有 一 个 全 面 的 了 解 。 那 么 对 于 一 名 员工 来 说 ， 他 对 项 目的 功能 没有 完全 了 解 ， 却 要 


为 该 项 目 出 力 ， 这 么 做 在 道德 上 是 否 合适 ”? 
4. 某 人 对 其 成 果 最 终 为 他 人 所 用 ， 应 当 负 多 大 的 责任 ? 
. 在 计算 机 专业 人 员 与 客户 之 间 的 关系 中 ， 专 业 人 员 的 责任 是 实现 客户 的 要 求 ， 还 是 对 客 


(LA 


户 的 要 求 加 以 指导 ? 如 果 专 业 人 员 预 见 到 客户 的 要 求 会 导致 缺乏 职业 道德 的 结果 发 生 ， 
该 怎么 办 ? 例如 ， 客 户 可 能 为 了 提高 效率 希望 走 捷径 ， 而 专业 人 员 预 见 到 所 采用 的 这 些 
捷径 ， 可 能 会 成 为 数据 错误 或 系统 误 用 的 根源 。 如 果 客 户 坚持 这 么 做 ， 那 么 专业 人 员 是 
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否 就 没有 责任 ? 

6. 如 果 技 术 的 发 展 太 过 迅猛 ， 发 明 者 还 未 来 得 及 从 他 的 发 明 中 获 利 ， 新 的 发 明 却 已 紧 随 而 
来 ， 取 而 代 之 。 这 样 将 会 发 生 什 么 ?这 种 获 利 对 激励 发 明 者 而 言 是 必需 的 吗 ? 开源 开发 
的 成 功 与 你 的 答案 有 什么 关系 ? 免费 的 高 质量 软件 足以 持续 支撑 现实 的 需求 吗 ? 

7. 计算 机 革命 能 否 有 助 于 或 者 说 帮助 解决 ) 世 界 能 源 问题 ? 对 其 他 的 一 些 大 规模 问题 ， 
如 饥饿 和 贫穷 ， 情 况 又 会 如 何 ? 

8. 技术 是 否 会 无 限期 地 发 展 下 去 ? 是否 有 什么 因素 会 逆转 社会 对 技术 的 这 种 依赖 ? 如 果 社 
会 继续 推进 技术 无 限期 地 发 展 下 去 ， 那 么 结果 将 会 怎样 ? 

9. 如果 你 有 一 台 时 间 机 器 ， 你 想 要 生活 在 哪个 历史 时 间 段 中 ? 是 否 有 你 想 带 走 的 当前 技 
术 ? 一 种 技术 能 与 另 一 种 技术 分 开 吗 ? 一 边 反 对 全 球 变 暖 ， 一 边 接受 现代 医学 治疗 ， 这 
现实 吗 ? 

10. 智能 手机 上 的 许多 应 用 会 自动 集成 其 他 应 用 提供 的 服务 。 这 种 集成 可 能 会 将 进入 一 个 应 
用 的 信息 与 另 一 个 应 用 共享 。 这 种 集成 的 好 处 是 什么 ? 过 多 的 集成 会 导致 什么 问题 吗 ? 
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数据 抽象 


章 将 要 研究 的 是 如 何 对 数据 组 织 形式 进行 模拟 ， 这 门 学 科 称 为 数据 结构 ， 它 不 同 于 

由 计算 机 主 存储 器 所 提供 的 以 一 个 个 单元 来 组 织 数据 的 方式 。 其 目标 是 让 数据 的 使 
用 者 将 数据 集 视 为 一 种 抽象 工具 来 访问 ， 而 不 是 从 计算 机 主 存储 器 中 数据 组 织 的 角度 去 考虑 问 
题 。 这 方面 的 研究 工作 将 向 我 们 展示 ， 构 造 这 种 抽象 工具 的 需求 是 如 何 产 生 对 象 和 面向 对 象 编 
程 概念 的 。 


本 章 内 容 

8.1 基本 数据 结构 8.5 ”定制 的 数据 类 型 
8.2 ”相关 概念 8.6 类 和 对 象 

8.3 ”数据 结构 的 实现 *8.7 ”机 器 语言 中 的 指针 


8.4 一 个 简短 的 案例 


第 6 章 已 经 介绍 了 数据 结构 这 个 概念 ,在 那 一 章 中 , 我们 了 解 到 : 程序 员 可 以 利用 高 级 程序 
设计 语言 所 提供 的 技术 来 表示 算法 ， 就 好 像 正 被 操作 的 数据 不 是 按照 一 个 个 单元 存储 在 主 存储 
器 中 的 ， 而 是 以 其 他 方式 存储 的 。 我 们 还 学 习 到 ， 程 序 设计 语言 所 支持 的 数据 结构 称 为 基本 结 
构 。 本 章 将 讨论 一 些 技 术 ， 利 用 这 些 技术 能 够 构建 和 操作 一 些 与 语言 的 基本 结构 不 同 的 数据 结 
构 ， 该 研究 能 够 使 我 们 从 传统 的 数据 结构 过 渡 到 面向 对 象 的 范 型 。 贯 罕 本 章 的 潜在 主题 是 抽象 
工具 的 构建 。 


8.1 基本 数据 结构 


这 里 ， 先 介绍 一 些 基本 的 数据 结构 作为 后 续 几 节 的 例子 。 
8.1.1 数组 和 聚合 


在 6.2 节 中 ,已 经 介绍 了 数组 和 聚合 类 型 这 两 种 数据 结构 。 回 顾 一 下 , 数组 是 一 种 “ 甜 形 的 ” 
数据 块 ， 其 项 具有 相同 的 类 型 。 最 简单 的 数组 形式 是 一 维 数 组 ， 由 一 行 元 素 组 成 ， 每 个 元 素 的 
位 置 由 一 个 下 标 确 定 。 例 如 ， 带 有 26 个 元 素 的 一 维 数组 可 用 于 存储 每 个 字母 表 字 母 在 一 页 文本 
中 出 现 的 次 数 。 一 个 二 维 数组 由 多 行 多 列 组 成 ， 其 中 ， 项 的 位 置 由 一 对 下 标 确定 ， 即 第 一 个 下 
标 值 确定 项 的 行 位 置 ， 第 二 个 下 标 值 确定 项 的 列 位 置 。 例 如 ， 用 一 个 矩形 数组 表示 销售 人 员 的 
每 月 销售 额 ， 每 行 的 项 代表 的 是 某 个 销售 人 员 每 月 的 销售 额 ， 每 列 的 项 代表 的 是 某 个 月 每 个 销 
售 人 员 的 销售 额 。 这 样 一 来 ， 第 3 行 第 1 列 的 项 就 可 以 表示 第 3 个 销售 人 员 1 月 份 的 销售 额 。 

与 数组 不 同 ， 聚 合 类 型 是 一 个 由 数据 项 组 成 的 块 ， 其 中 的 各 个 数据 项 可 能 具有 不 同 的 类 型 
和 大 小 。 块 里 的 项 通常 称 为 字段 。 例 如 ， 用 一 个 聚合 类 型 的 数据 块 表示 一 个 员工 ， 其 字段 可 能 
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有 三 项 : 员工 的 名 字 《〈 字 符 型 数组 )、 年 龄 〈 整 型 ) 以 及 技能 等 级 〈 泽 点 型 )。 聚 合 类 型 中 的 字 
段 通常 都 不 是 通过 数字 下 标号 来 访问 的 ， 而 是 通过 字段 名 来 访问 的 。 


8.1.2 列表、 栈 和 队列 


另 一 种 基本 数据 结构 是 列表 (list)， 它 是 一 个 集合 ， 其 表 项 按 顺 序 排列 ( 见 图 8-1a)。 列 表 
的 开头 称 为 表 头 ‘head)， 列 表 的 尾 端 称 为 表 尾 (tail)。 

几乎 所 有 的 数据 集合 都 可 以 看 成 是 列表 。 例 如 ， 文 本 可 以 看 成 是 符号 的 列表 ， 二 维 数组 
可 以 看 成 是 行 的 列表 ，CD 上 记录 的 音乐 可 以 看 成 是 声音 的 列表 。 比 较 传 统 的 例子 包括 客人 
名 单 、 购 物 清 单 、 班 级 注册 表 和 库存 清单 。 与 列表 相关 的 操作 视 情 况 而 定 。 在 某 些 情况 下 ， 
我 们 可 能 需要 从 列表 中 移 除 项 ， 向 列表 中 添加 新 项 ， 每 次 “处 理 ” 列 表 中 的 一 个 项 ， 改 变 项 
在 列表 中 的 排列 , 或 者 搜索 查看 某 个 特殊 的 数据 项 是 否 在 列表 中 。 我 们 将 在 本 章 的 后 面 讨论 
这 些 操作 。 

通过 严格 限制 列表 中 项 的 访问 方式 ， 我 们 可 以 得 到 两 种 特殊 类 型 的 表 一 一 栈 和 队列 。 栈 
(stack) 是 这 样 的 一 种 列表 ， 其 项 只 能 在 表 头 进行 添加 和 删除 〈 见 图 8-lb)。 例 如 ， 一 个 由 书 组 
成 的 栈 ， 其 物理 限制 决定 了 所 有 的 添加 和 删除 都 只 能 在 顶部 进行 。 用 通俗 的 术语 来 讲 ， 栈 的 头 
称 为 栈 顶 (top), 栈 的 尾 称 为 栈 底 ‘bottom 或 base )。 在 栈 顶 添加 一 个 新 的 项 称 为 入 栈 (pushing)， 
在 栈 顶 删除 一 个 项 称 为 出 栈 (popping)。 注 意 ， 最 后 放 入 栈 中 的 项 总 是 被 最 先 移 除 ， 因 此 我 们 
说 栈 是 一 种 后 进 先 出 〈Last-Im，First-Out，LIFO， 读 作 “LIE-foe”) 结构 。 

这 种 后 进 先 出 特性 意味 着 ， 对 于 那些 必须 逆 着 存储 次 序 进行 检索 的 数据 项 而 言 ， 栈 是 理想 
的 选择 ， 因 此 栈 经 常 被 用 作 回 漳 活 动 的 基础 。[ 术 语 回溯 〈backtracking) 是 指 退出 系统 的 过 程 ， 
它 与 进入 系统 的 次 序 相 反 。 一 个 经 典 的 例子 是 : 为 了 找到 走出 森林 的 路 径 而 原 路 返回 。] 例如 ， 
思考 一 下 支持 递归 过 程 所 需 的 基本 结构 ， 在 每 一 个 新 活动 开始 时 ， 先 前 的 活动 必须 保存 下 来 。 
而 且 ， 在 每 一 个 活动 结束 时 ， 必 须 检 索 前 一 个 保存 的 活动 。 这 样 ， 如 果 当 活动 被 保存 时 就 会 压 
入 栈 中 ， 那 么 每 次 需要 检索 一 个 活动 时 ， 合 适 的 活动 将 处 在 栈 项。 

队列 〈queue) 是 这 样 的 一 种 列表 ， 其 表 项 只 能 从 表 头 删除 ， 新 表 项 只 能 从 表 尾 插入 。 这 种 
数据 结构 的 例子 有 ， 戏 院 门口 排队 等 待 购 票 的 一 队 人 《和 见 图 8-1c)， 这 里 ， 位 于 队列 头 的 人 先 购 
票 ， 而 新 到 的 人 必须 到 队 尾 进行 排队 购 票 。 在 第 3 章 中 ， 我 们 遇 到 过 这 种 数据 结构 ， 在 那 节 中 ， 
批 处 理 操作 系统 所 存储 的 作业 必须 在 所 谓 的 作业 队列 中 进行 排队 ， 等 待 执行 。 我 们 还 了 解 到 ， 
队列 是 一 种 先进 先 出 (First-In，First-Out，FIFO， 读 作 “FIE-foe”) 结构 ， 这 意味 着 表 项 是 以 它 

们 存储 的 顺序 从 队列 中 移 除 的 。 


队列 
划一- 一 未 志 一 模 项 [] 
Bob 
列表 售票 口 
-~ JS AAA 
Maurice 一 一 表 尾 一 栈 底 队 尾 一 J 队 头 
(a) 由 名 字 组 成 的 列表 (b) 由 书 组 成 的 栈 (c) 由 人 组 成 的 队列 


图 8-1 列表 、 栈 和 队列 
第 1 章 中 介绍 过 ， 队 列 常 被 用 作 缓 冲 区 的 基本 结构 ,缓冲 区 是 从 一 处 传送 到 另 一 处 的 数据 临 
时 放置 的 存储 区 域 。 当 数据 项 到 达 绥 冲 区 时 ， 会 被 放置 在 队列 的 末尾 。 当 数据 项 需要 转发 到 它 
们 最 终 的 目的 地 时 ， 会 按 其 在 队列 头 部 出 现 的 次 序 被 转发 。 因 此 ， 数 据 转 发 的 次 序 就 是 它们 到 


260 第 8 章 数据 抽象 
达 的 次 序 。 
8.1.3 树 
树 (tree) 是 这 样 的 一 个 数据 集合 ， 其 项 具有 层次 化 的 组 织 形式 ,很 像 一 个 典型 公司 的 组 织 
关系 图 〈 见 图 8-2)。 在 这 种 组 织 图 中 ， 顶 部 表示 总 裁 ， 由 分 支线 下 连 到 副 总 裁 ， 副 总 裁 又 连 到 
地 区 经 理 ， 等 等 。 对 树 结构 的 这 种 直观 性 的 定义 ， 我 们 还 要 加 上 一 个 限制 性 条 件 ， 即 (参照 组 
织 图 ) 公司 的 任何 一 个 员工 只 有 一 个 直接 上 司 。 也 就 是 说 ， 组 织 中 的 不 同 分 支 不 会 在 下 一 层 相 
遇 。( 第 6 章 已 经 举 过 儿 个 树 的 例子 ， 是 以 语法 分 析 树 的 形式 介绍 的 。) 


sk 






图 8-2 组织 图 的 一 个 例子 


树 中 的 每 一 个 位 置 称 为 一 个 节点 〈node)〈 见 图 8-3)。 树 顶部 的 那个 节点 称 为 根 节点 (root 
node)， 如 果 我 们 把 图 倒 过 来 看 ， 这 个 节点 就 表示 了 树 的 根 。 另 一 端点 处 的 节点 称 为 终端 节点 
(terminal node)， 有 了 时 也 称 为 叶子 节点 (leaf node)。 我 们 常 将 从 根 到 叶子 的 最 长 路 径 上 的 节点 
数 称 为 树 的 深度 〈depth)。 换 名 话说 ， 一 棵 树 的 深度 就 是 该 树 所 包含 的 水 平 层 数 。 


根 节点 





图 终端 (或 叶子 ) 节点 
图 8-3 ” 树 的 术语 
有 时 ， 我 们 在 提 及 树 结构 时 ， 就 感觉 像 是 每 个 节点 直接 派生 出 了 它 下 一 层 的 节点 。 所 以 我 


们 常常 会 说 到 一 个 节点 的 祖先 或 后 代 。 我 们 称 一 个 节点 的 直接 后 代为 其 子 〈children) 节点 ， 称 
其 直接 祖先 为 其 父 (parent) 节点 。 此 外 ， 将 有 同一 个 父 节点 的 那些 节点 称 为 兄弟 〈sibling) 节 
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点 。 如 果 一 棵 树 的 每 个 父 节 点 有 不 多 于 两 个 的 子 节 点 ， 那 么 称 该 树 为 二 叉 树 (binary tree )。 

我 们 发 现 ， 如 果 我 们 选择 一 棵 树 中 的 任意 一 个 节点 ， 那 么 该 节点 与 其 下 层 的 那些 节点 也 能 
构成 一 个 树 结构 ， 我 们 称 这 些 较 小 的 结构 为 子 树 (subtree)。 这 样 一 来 ， 每 个 子 节点 都 是 其 父 节 
点 下 面 的 子 树 的 根 ， 这 样 的 子 树 称 为 父 节点 的 一 个 分 支 (branch)。 在 二 又 树 中 ， 提 到 树 的 显示 

方式 时 我 们 经 常会 谈 到 ， 一 个 节点 的 左 子 树 和 右 子 树 。 


问题 与 练习 


. 举 出 下 列 每 种 结构 的 一 些 《计算 机 科学 以 外 的 ) 例子 ， 列表 、 栈 、 队 列 和 树 。 
2. 总 结 出 列表 、 栈 及 队列 两 两 之 间 的 区 别 。 

3. 假设 A 字母 被 放 入 一 个 空 栈 中 ， 然 后 依次 是 字母 B 和 C。 再 假设 一 个 字母 出 栈 ， 字 母 D 和 E 入 栈 。 请 将 酚 
中 字母 按照 从 栈 顶 到 栈 底 出 现 的 顺序 排列 出 来 。 如 果 此 时 一 个 字母 要 出 栈 ， 那 么 哪个 字母 会 被 检索 ? 
. 假设 字母 A 被 放 入 一 个 空 队列 中 ， 然 后 依次 放 入 字母 B 和 C。 再 假设 此 队列 中 一 个 字母 被 移出 ， 之 后 
插入 字母 D 和 E。 请 按照 字母 在 队列 中 从 表 头 到 表 尾 出 现 的 顺序 列 出 它们 。 如 果 此 时 再 要 从 队列 中 移 

出 一 个 字母 ， 应 该 是 哪个 字母 ? 
. 假设 一 棵 树 有 4 个 节点 ，A、B、C 和 D。 如 果 A 和 C 是 兄弟 ， 并 且 D 的 父 节点 是 4， 那么 哪些 节点 是 叶 
子 节点 ? 哪个 节点 是 根 节点 ? ; hd, | 


一 


Cn 


一 一 一 一 一 一 一 一 一 一 .一 一 ee cr 


8. 2 相关 概念 


在 本 节 中 , 我们 将 分 别 讨论 3 个 与 数据 结构 紧密 相关 的 主题 抽象 、 静 态 结构 与 动态 结构 之 
间 的 区 别 以 及 指针 的 概念 。 


8.2.1 抽象 


前 一 节 中 介绍 的 数据 结构 通常 与 数据 有 关 。 然 而 ， 计 算 机 的 主 存储 器 并 不 是 按照 数组 、 列 
表 、 栈 、 队 列 和 树 这 样 的 结构 来 组 织 的 ， 而 是 由 一 组 可 寻 址 的 存储 单元 顺序 组 成 的 。 这 样 一 来 ， 
所 有 的 其 他 结构 都 必须 进行 模拟 。 如 何 完成 这 种 模拟 工作 是 本 章 的 主题 。 到 现在 为 止 ， 我 们 只 
是 指出 ， 数 组 、 列 表 、 栈 、 队 列 和 树 这 样 的 组 织 都 是 抽象 工具 ， 之 所 以 构造 这 些 抽 象 工具 ， 是 
为 了 使 数据 用 户 不 用 关心 实际 数据 存储 的 细节 ， 可 以 很 方便 地 访问 数据 ， 就 好 像 这 些 信息 是 以 
一 种 较为 方便 的 形式 存储 的 。 

在 这 里 ， 用 户 这 个 术语 并 不 一 定 是 指 人 ， 这 个 词 的 含义 取决 于 我 们 当时 的 观点 。 如 果 从 一 
个 使 用 PC 来 维护 保龄球 联赛 记录 的 人 的 角度 考虑 ， 那 么 用 户 就 是 一 个 人 。 在 这 种 情况 下 ， 应 用 
软件 “也 许 是 电子 制 表 软 件 包 ) 将 负责 把 数据 用 人 觉得 方便 访问 的 抽象 形式 表示 出 来 很 可 能 
用 数组 来 表示 )。 如 果 从 因特网 上 的 一 个 服务 器 的 角度 考虑 ， 那 么 这 时 的 用 户 可 以 是 一 个 客户 
端 。 在 这 种 情况 下 ， 服 务 器 将 负责 把 数据 表示 成 便于 客户 端 访问 的 抽象 形式 。 如 果 从 程序 的 模 
块 结构 来 考虑 ， 那 么 用 户 应 该 是 需要 访问 这 些 数据 的 任何 模块 。 在 这 种 情况 下 ， 模 块 所 包含 的 
数据 应 该 负责 把 数据 表示 成 便于 其 他 模块 访问 的 抽象 形式 。 所 有 这 些 情况 中 ， 有 一 条 共同 的 主 
线 ， 那 就 是 用 户 拥 有 将 数据 作为 一 个 抽象 工具 来 访问 的 特权 。 


8.2.2 ”静态 结构 与 动态 结构 


构建 抽象 数据 结构 中 的 一 个 重要 区 别 是 ， 所 模拟 的 结构 是 静态 的 还 是 动态 的 ， 也 就 是 说 ， 
结构 的 形状 或 大 小 是 否 会 随时 间 改 变 。 例 如 ， 如 果 这 个 抽象 工具 是 一 个 名 字 列 表 ， 那 么 考虑 以 
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下 情况 将 非常 重要 : 这 份 名 字 列 表 是 会 一 直 保持 固定 的 大 小 ， 还 是 可 能 因 名 字 的 增加 和 删除 而 
扩大 和 缩小 。 
就 一 般 规律 而 言 ， 静 态 结构 比 动态 结构 更 容易 处 理 。 如 果 一 个 结构 是 静态 的 ， 那 么 只 

要 提供 一 种 能 够 访问 结构 中 不 同 数据 项 的 方法 ， 或 许 还 需要 提供 一 -种 能 改变 指定 位置 的 数据 
值 的 方法 。 但 是 ， 如 果 结 构 是 动态 的 ， 那 就 必须 要 处 理 增加 和 删除 项 的 问题 ， 还 要 找到 因数 
据 结构 增长 所 需 的 存储 空间 。 在 结构 设计 不 合理 的 情况 下 ， 增 加 一 个 新 项 可 能 会 导致 对 结构 
进行 大 规模 的 重 排 ， 而 且 结构 的 过 度 增 长 可 能 会 迫使 整个 结构 转移 到 另 一 个 可 用 空间 更 大 的 
存储 区 域 。 


8.2.3 指针 


我 们 知道 计算 机 主 存储 器 中 的 各 个 单元 是 由 数字 地 址 来 标识 的 。 作 为 数值 ， 这 些 地 址 本 身 
就 可 以 进行 编码 并 存储 在 存储 单元 中 。 指 针 (pointer) 就 是 包含 这 种 编码 地 址 的 一 个 存储 区 。 
就 数据 结构 来 说 ， 指 针 是 用 来 记录 数据 项 存储 位 置 的 。 例 如 ， 如 果 我 们 必须 要 重复 地 将 一 个 数 
据 项 从 一 个 位 置 移 到 另 一 个 位 置 ， 那 么 可 以 指定 一 个 固定 的 位 置 来 作为 一 个 指针 。 这 样 一 来 ， 
每 次 移动 该 项 时 ， 就 能 够 通过 更 新 这 个 指针 来 反映 数据 的 新 地 址 。 接 下 来 ， 当 要 访问 该 数据 项 
时 ， 就 可 以 通过 指针 来 找到 该 项 。 事 实 上 ， 指 针 将 一 直 “ 指 向 ”该 数据 。 

在 第 2 章 学 习 CPU 的 过 程 中 ， 已 经 遇 到 过 指针 这 个 概念 。 在 那 一 章 中 ， 我 们 看 到 ， 称 为 程序 
计数 器 的 寄存 器 被 用 来 存放 下 一 条 要 执行 的 指令 的 地 址 ， 所 以 ， 程 序 计 数 器 就 起 到 了 指针 的 作 
用 。 事 实 上 ， 程 序 计数 器 的 另 一 个 名 字 叫 作 指 令 指 针 (instruction pointer )。 

举 一 个 指针 应 用 的 例子 ， 假 设 我 们 有 一 份 小 说 的 清单 ， 按 照 小 说 名 的 字母 顺序 存储 在 计算 
机 的 存储 器 中 。 虽 然 在 许多 应 用 中 ， 这 样 的 安排 比较 方便 ， 但 是 要 找到 某 个 作者 的 所 有 小 说 作 
品 就 比较 困难 了 ， 因 为 它们 分 散在 整个 列表 中 。 为 了 解决 这 个 问题 ， 可 以 在 表示 一 本 小 说 的 每 
个 存储 单元 块 中 保留 一 个 额外 的 存储 单元 ， 并 将 该 存储 单元 用 作 一 个 指针 ， 指 向 表示 这 同一 
作者 一 本 书 的 另 一 个 块 。 通 过 这 种 方法 ， 同 一 作者 的 所 有 小 说 就 可 以 链接 成 一 个 环 〈 见 图 8-4)。 
一 旦 找到 给 定 作者 的 一 本 小 说 ， 就 可 以 循 着 指针 一 本 接 男 一 本 地 找到 该 作者 的 所 有 小 说 。 









欧 内 斯 特 ， 海明威 的 
《永别 了 ， 武 器 》 


欧 内 斯 特 ， 海 明 威 的 
《 飞 钟 为 谁 而 鸣 》 





欧 内 斯 特 ， 海明威 的 
《太阳 照常 升 起 》 


所 撒 奸 









图 8-4 按 小 说 名 排列 、 根 据 作者 链接 的 小 说 


现代 的 许多 程序 设计 语言 都 把 指针 作为 一 种 基本 的 数据 类 型 。 也 就 是 说 ， 这 些 语言 允许 对 
指针 进行 声明 、 分 配 和 操作 ， 就 像 对 整数 和 字符 串 那样 。 利 用 这 种 语言 ， 程 序 员 就 能 在 机 器 的 
存储 器 中 ， 把 相关 的 项 用 指针 相互 链接 起 来 ， 从 而 设计 出 精巧 的 数据 网 。 


问题 与 练习 
1. 数组 、 列 表 、 栈 、 队 列 和 树 等 数据 结构 在 何 种 意义 上 是 抽象 的 ? 

出 一 个 涉及 静态 数据 结构 应 用 的 例子 。 再 举 出 一 个 涉及 动态 数据 结构 应 用 的 例子 。 
| [机 科学 领域 外 出 现 指针 这 个 概念 的 例子 。 








8.3 ”数据 结构 的 实现 263 


8.3 ”数据 结构 的 实现 


现在 我 们 来 讨论 前 一 节 所 介绍 的 一 些 数据 结构 在 计算 机 主 存储 器 中 的 存储 方式 。 正 如 第 6 
章 所 介绍 的 ， 在 高 级 程序 设计 语言 中 ， 和 常常 将 这 些 结构 作为 基本 结构 来 提供 。 在 此 ， 我 们 的 目 
标 就 是 要 理解 如 何 将 处 理 这 些 结构 的 程序 翻译 成 用 来 处 理 存放 在 主 存储 器 中 的 数据 的 机 器 语言 
程序 。 


8.3.1 存储 数组 


我 们 首先 讨论 存储 数组 的 技术 。 

假设 要 存储 一 个 24 小 时 温度 读数 的 序列 ， 每 个 读数 需要 存储 空间 的 一 个 存储 单元 。 此 外 ， 
假设 依据 它们 在 序列 中 的 位 置 来 确定 这 些 读 数 。 也 就 是 说 , 我 们 要 能 够 访问 第 1 个 读数 或 者 是 第 
5 个 读数 。 简 单 来 说 ， 就 是 要 按照 一 维 数组 的 方式 来 处 理 这 个 序列 。 

这 里 ， 只 要 将 这 些 读数 按 顺 序 存储 在 具有 连续 地 址 的 24 个 存储 单元 中 ， 就 可 以 实现 这 个 目 
标 了 。 在 这 种 情况 下 ， 如 果 这 个 序列 中 第 1 个 单元 的 地 址 是 x， 那 么 任何 一 个 指定 温度 读数 可 以 
通过 “用 所 需 读 数 的 序号 减 去 1， 然 后 将 计算 的 结果 加 上 x?” 来 得 到 。 有 具体 来 说 ， 第 4 个 读数 就 放 
在 xX+(4 一 1) 这 个 地 址 中 ， 如 图 8-5 所 示 。 





此 下 X x+1 x+2 x+3 x+4 x+5 X+6 


地 
存储 单元 -一 | 


Readings[1] 







Readings[2] 


Readings[3] 
Readings[4] 
图 8-5 存储 在 存储 器 中 的 温度 读数 数组 ， 起 始 地 址 为 x 
这 种 技术 为 大 多 数 高 级 程序 设计 语言 的 翻译 程序 所 采用 ， 用 以 实现 一 维 数组 。 当 翻译 程序 
遇 到 下 面 这 样 的 声明 语句 时 ; 
int Readings[24]; 
就 表明 ，Readings 这 个 术语 是 指 可 以 存放 24 个 整数 值 的 一 维 数组 ,这 时 ,翻译 程序 会 安排 预 留 
24 个 连续 的 存储 单元 。 以 后 在 程序 中 ， 如 果 遇 到 赋值 语句 
Readings [4] = 67; 


就 要 求 将 值 67 放 入 数组 Readings 的 第 4 项 中 。 此 时 ， 翻 译 程序 就 生成 了 一 串 机 器 指令 ， 把 值 67 
放 入 地 址 为 x+(4-1) 的 存储 单元 中 ， 其 中 x 为 与 数组 Readings 相 关 的 存储 块 中 第 一 个 单元 的 地 
址 。 通 过 这 种 方式 ， 程 序 员 在 编写 程序 的 时 候 ， 就 可 以 认为 温度 读数 确实 存储 在 一 个 一 维 数组 
中 。( 注 意 ， 在 Python、C、C++、C# 及 Java 语 言 中 ， 数 组 的 下 标 是 从 0 而 不 是 从 1 开始 的 ， 这 样 
一 来 ， 第 4 个 读数 应 该 由 Readings [3] 表 示 。 见 本 节 末 的 问题 与 练习 3。) 

现在 ， 假 设 我 们 要 记录 一 个 公司 的 销售 人 员 一 周 内 的 销售 业绩 。 在 这 种 情况 下 ， 可 以 想象 
将 数据 组 织 成 一 个 二 维 数组 。 在 该 数组 中 ， 每 行 的 值 表示 某 个 员工 的 销售 业绩 ， 而 每 列 中 的 值 
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表示 某 一 天 内 所 有 的 销售 业绩 。 

为 了 满足 这 种 要 求 ， 首 先 要 认识 到 这 个 数组 是 静态 的 ， 即 使 它 的 内 容 得 到 更 新 ， 其 大 小 也 
不 会 改变 。 这 样 就 可 以 计算 出 整个 数组 所 需 的 存储 区 的 总 数 ， 从 而 保留 出 一 块 这 个 大 小 的 连续 
存储 单元 。 接 下 来 把 数据 一 行 一 行 地 存 入 数组 。 从 所 保留 的 存储 块 的 第 1 个 存储 单元 起 ， 把 数组 
第 1 行 数值 存 进 连续 的 存储 单元 ;接着 存放 下 一 行 ， 再 下 一 行 ， 以 此 类 推 〈 见 图 8-6)。 这 种 存储 
系统 采用 的 存储 方式 是 行 主 序 (row major order)， 与 之 相反 的 是 列 主 序 (column major order )， 
列 主 序 是 将 数据 一 列 一 列 地 存 入 数组 。 


概念 数组 





计算 机 的 存储 器 


人 TITLE 








第 3 行 第 4 列 的 项 
图 8-6 ”以 行 主 序 方式 存储 的 一 个 4 行 5 列 二 维 数组 


如 果 数 据 以 这 种 方式 存储 ,那么 考虑 一 下 ,如 何 找到 数组 中 第 3 行 第 4 列 的 数值 ? 设想 一 下 ， 
我 们 处 在 所 保留 的 机 器 存储 块 的 第 1 个 单元 。 从 这 个 位 置 起 ， 可 以 依次 找到 数组 第 1 行 的 数据 ， 
接着 是 第 2 行 ， 然 后 是 第 3 行 ， 依 次 类 推 。 要 得 到 第 3 行 的 数据 ， 我 们 必须 先 经 过 第 1 行 和 第 2 行 。 
由 于 每 一 行 有 5 项 (星期 一 至 星期 五 ， 每 天 1 项 )， 因 此 要 访问 到 第 3 行 的 第 1 项 ， 总 共 需 要 经 过 10 
项 。 从 那 起 ， 我 们 还 要 再 经 过 3 项 ， 才 能 到 达 第 3 行 第 4 列 的 那个 项 。 这 样 ， 为 了 到 达 第 3 行 第 4 
列 的 项 ， 从 存储 块 的 开始 处 总 共 需 要 经 过 13 项 。 

上 述 的 计算 过 程 可 以 概括 为 一 个 公式 ， 即 可 以 将 行列 位 置 的 索引 转换 为 实际 的 存储 地 址 。 
有 具体 来 说 ， 如 果 令 c 表 示 一 个 数组 的 列 数 〈 也 就 是 每 行 所 包含 的 项 的 个 数 )， 那 么 第 ; 行 第 7 列 项 
的 地 址 就 可 以 表示 为 : 

x+(cx(i-1))+ ( 广 1) 

其 中 ，x 是 第 1 行 第 1 列 项 的 单元 地 址 。 也 就 是 说 ， 必 须 经 过 i-1 行 (每 行 包括 c 项 )， 才 能 到 达 第 i 
行 ， 然 后 再 经 过 六 1 项 ， 才 能 到 达 这 行 的 第 j 项 。 在 我 们 之 前 的 例子 中 ，c=5， 二 3， 折 4， 所 以 ， 如 
果 数 组 从 地 址 x 进行 存储 ， 那 么 第 3 行 第 4 列 的 项 的 地 址 就 应 该 为 x+(5x(3 一 1)))+(4-D=x+13 。 表 
达 式 (cx(i--1))+0 一 1) 有 时 候 称 为 地 址 多 项 式 (address polynomial)。 

这 也 是 大 多 数 高 级 程序 设计 语言 的 翻译 程序 所 采用 的 技术 。 当 遇 到 声明 语句 

int Sales[8,5]; 

时 ， 则 表明 Sales 是 一 个 8 行 5 列 的 二 维 整数 数组 ， 因 此 翻译 程序 会 留 出 40 个 连续 的 存储 单元 。 
以 后 如 果 遇 到 赋值 语句 

Sales[3,4] = 5; 

则 需要 将 数值 5 放 到 数组 Sales 的 第 3 行 第 4 列 的 那个 项 中 ， 此 时 ， 就 产生 一 串 机 器 指令 ， 将 
数值 5 放 到 地 址 为 x+5x(3-1)+(4-1) 的 存储 单元 中 ， 其 中 ，x 是 与 数组 Sales 相 关联 的 存储 块 的 第 1 
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个 单元 的 地 址 。 通 过 这 种 方式 ， 程 序 员 编 写 程序 时 ， 就 好 像 销 售 量 确实 存放 在 一 个 二 维 数组 中 
一 样 。 


8.3.2 存储 聚合 


现在 ， 假 设 要 存储 的 聚合 称 为 Bmployee， 由 3 个 字段 组 成 : Name (字符 型 数组 )、Age( 整 
型 ) 和 Skill1Rating( 浮 点 型 )。 如 果 每 个 字段 所 需 的 存储 单元 的 数目 是 固定 的 ， 那 么 就 可 以 
将 聚合 存储 在 一 个 连续 的 单元 块 中 。 例 如 ， 假 设 Name 字 段 最 多 需要 25 个 单元 ，aAge 只 需要 一 个 
单元 ，Skil1Rating 也 只 需要 一 个 单元 。 那 么 ， 我 们 就 可 以 预 留 出 一 个 有 27 个 连续 单元 的 存储 
块 ， 开 始 的 25 个 存储 单元 用 来 存储 员工 的 名 字 ， 第 26 个 存储 单元 用 来 存储 员工 的 年 龄 ， 最 后 一 
个 存储 单元 用 来 存储 员工 的 技能 等 级 〈 见 图 8-7a )。 


Employee 
Employee .Name Employee .Age Employee.SkillRating 
地 址 : x X+25 x+26 


(a) 存储 在 一 个 连续 存储 块 中 的 聚合 


Employee .Name 





指针 | Employee .Age 


Employee.SkillRating 


(b) 存储 在 不 同 单元 的 聚合 字段 
图 8-7 存储 聚合 类 型 Employee 


通过 这 种 安排 ， 就 可 以 很 容易 地 访问 该 聚合 中 不 同 的 字段 。 在 知道 聚合 开始 地 址 以 及 聚合 
中 所 需 字 段 的 偏 移 量 的 情况 下 ， 字 段 的 引用 可 以 被 翻译 成 存储 单元 。 例 如 ， 如 果 第 一 个 存储 单 
元 的 地 址 是 zx， 那么 指向 Employee.Name( 意 思 是 Employee 聚 合 中 的 Name 字 段 ) 的 任何 引用 都 
将 翻译 成 从 地 址 x 开 始 的 25 个 存储 单元 ， 而 指向 Employee.Age(〈 意 思 是 Employee 聚 合 中 的 Age 
字段 ) 的 引用 将 翻译 成 地 址 为 x+25 的 存储 单元 。 具 体 来 说 ， 如 果 翻 译 程序 遇 到 了 高 级 语言 中 的 
这 样 一 条 语句 : 


Employee.Age = 22; 


那么 只 要 产生 一 系列 机 器 语言 指令 ， 用 以 将 数值 22 放 入 地 址 为 x +25 的 存储 单元 。 

在 一 个 连续 存储 单元 块 中 存储 聚合 的 另 一 种 方法 就 是 ， 将 聚合 的 每 个 字段 分 别 存放 在 不 同 
的 位 置 ， 然 后 通过 指针 的 方式 将 它们 链接 在 一 起 。 更 准确 地 说 ， 如 果 这 个 聚合 包含 有 3 个 字段 ， 
那么 就 在 存储 器 中 找到 一 个 位 置 ， 用 以 存放 3 个 指针 ， 每 个 指针 指向 一 个 字段 〈 见 图 8-7b)。 如 
果 这 些 指 针 存储 在 以 x 为 起 始 地 址 的 存储 块 中 ， 那 么 通过 存储 在 地 址 x 处 的 指针 就 可 以 找到 第 1 
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个 字段 ， 通 过 存放 在 地 址 x +1 处 的 指针 就 可 以 找到 第 2 个 字段 ， 以 此 类 推 。 

这 种 存储 方式 对 于 聚合 字段 的 大 小 是 动态 的 情况 尤其 适用 。 举 例 来 说 ,利用 这 种 指针 系统 ， 
只 需要 在 存储 器 中 找到 一 个 存储 区 来 存放 较 大 的 字段 ， 然 后 调整 相关 的 指针 指向 这 个 新 位 置 ， 
就 可 以 增加 第 一 个 字段 的 大 小 。 但 是 ， 如 果 聚 合 存放 在 一 个 连续 的 存储 块 中 ， 就 不 得 不 修改 整 
个 结构 。 


8.3.3 存储 列表 


现在 来 讨论 将 一 个 名 字 列 表 存 储 在 一 个 计算 机 主 存储 器 中 的 技术 。 一 种 策略 就 是 将 整个 列 
表 存 入 具有 连续 地 址 的 一 整 块 存储 单元 中 。 假定 每 个 名 字 不 超过 8 个 字母 , 我 们 可 以 把 这 个 大 的 
整 块 存储 单元 分 成 一 组 子 块 ， 每 个 子 块 包含 有 8 个 存储 单元 。 每 个 子 块 中 存储 一 个 用 ASCII 码 记 
录 的 名 字 ， 一 个 单元 存储 一 个 字母 。 如 果 一 个 名 字 不 足 填 满分 配给 子 块 的 所 有 存储 单元 ， 只 需 
用 空格 的 ASCII 码 将 剩余 的 单元 填 满 就 行 。 利 用 这 个 系统 ， 存 储 一 个 10 个 名 字 的 列表 需要 一 个 
有 80 个 连续 存储 单元 的 存储 块 。 

图 8-8 所 概括 的 就 是 刚刚 描述 的 那个 存储 系统 。 其 重点 在 于 ， 整 个 列表 都 存储 在 一 大 块 内 存 
中 ， 其 连续 的 项 依次 存放 在 相 邻 的 存储 单元 中 。 这 样 的 一 种 组 织 称 为 邻接 表 (contiguous list)。 


存储 单元 的 连续 块 





第 一 个 名 字 第 一 个 名 字 最 后 一 个 名 
存储 在 这 里 存储 在 这 里 字 存 储 在 这 里 


图 8-8 名单 作为 一 个 邻接 表 存 储 在 存储 器 中 





类 多 数 高 pp 构 二 寻 作 才 天 检 原 语 ， 有 2 它们 都 是 建 和 操作 邻接 表 

的 方便 工具 。 如 果 列 表 的 各 个 项 都 是 相同 的 基本 数据 类 型 ， 那 么 该 列表 就 是 一 个 一 维 数 组 。 
稍微 复杂 的 例子 是 文中 讨论 过 的 一 个 有 10 个 名 字 的 列表 , 每 个 名 字 不 超过 8 个 字符 . 这 种 情况 
下 ， 程 序 员 可 以 将 一 个 邻接 表 构 建 为 一 个 10 行 8 列 的 二 维 字符 数组 ， 该 表 可 以 用 图 8-6 所 表示 
的 结构 来 表示 (假设 该 数组 以 行 主 序 进行 存储 )。 

许多 高 级 语言 都 含有 支持 这 种 列表 实现 的 功能 。 例如， 假设 将 上 面 所 提 到 的 二 维 字符 数 
组 称 为 MemberList， 那么 在 传统 的 表示 法 里 ， 表 达 式 MemberList [3,5] 指 的 就 是 第 3 行 第 5 
列 的 那个 字符 ; britok[31 指 的 且 整 作 蘑 3 本 ;也 
就 是 列表 中 的 第 3 项 . 


邻接 表 这 种 存储 结构 用 来 实现 静态 列表 很 方便 ， 但 对 动态 列表 来 说 ， 却 有 些 不 便 之 处 ， 因 
为 名 字 的 添加 和 删除 都 会 导致 不 断 地 对 项 进行 移 位 操作 ， 这 样 就 比较 耗 时 。 在 最 坏 的 情况 下 ， 
项 的 增加 甚至 会 导致 这 样 一 个 问题 : 为 了 能 够 获得 足够 大 的 存储 单元 块 来 存放 这 个 扩展 过 的 列 
表 ， 必 须 把 整个 列表 移 到 一 个 新 的 位 置 。 

如 果 一 个 列表 中 的 各 个 项 不 必 一 起 存储 在 一 个 连续 的 大 块 存储 区 中 ， 而 可 以 各 自 存储 在 不 
同 的 存储 区 ， 那 么 这 些 问 题 就 可 以 得 到 简化 。 为 了 说 明 这 个 问题 ， 仍 然 考虑 存储 名 子 列表 的 例 
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子 〈 每 个 名 字 不 超过 8 个 字母 )。 这 次 ， 将 每 个 名 字 存 储 在 一 个 有 9 个 连续 存储 单元 的 块 中 。 前面 
8 个 存储 单元 用 来 存放 名 字 本 身 ,最 后 一 个 单元 用 作 指 针 ， 指 向 列表 中 的 下 一 个 名 字 。 遵 循 这 种 
方法 ， 整 个 列表 可 以 分 散在 若干 个 小 的 由 指针 链接 起 来 的 9- 单 元 块 中 。 由 于 这 个 链接 系统 ， 这 
种 数据 的 组 织 方式 称 为 链表 (linked list)。 

为 了 记录 链表 的 起 始点 ， 我 们 另外 再 设 一 个 指针 ， 用 来 存储 第 一 项 的 地 址 。 由 于 这 个 指针 
是 指向 链表 的 起 始点 ， 或 者 叫 头 节点 ， 所 以 将 此 指针 称 为 头 指 针 (head pointer )。 

为 了 标记 链表 的 结尾 , 我 们 使 用 了 nul 指 针 [null pointer, 在 一 些 程序 设计 语言 中 也 称 为 NIL 
指针 (NIL pointer)， 在 Python 中 称 为 None 对 象 ]， 这 只 是 放 在 最 后 一 项 的 指针 单元 中 的 一 个 特 
殊 的 位 模式 ， 用 来 表示 链表 中 不 会 再 有 别 的 项 。 例 如 ， 如 果 约 定 不 会 在 0 地 址 存储 表 项 ， 那 么 0 
值 就 不 会 成 为 合法 的 指针 值 ， 因 而 就 可 以 将 0 值 用 作 null 指 针 。 

最 后 的 链表 结构 如 图 8-9 所 示 ， 图 中 用 儿 个 单个 的 矩形 表示 存放 链表 的 分 散 存 储 块 。 每 个 矩 
形 都 标识 出 了 它们 的 组 成 元 素 。 每 个 指针 由 一 个 从 指针 本 身 指向 指针 被 访 地 址 的 箭头 表示 。 如 
果 要 遍历 整个 链表 ， 就 需 按 照 头 指针 找到 第 一 个 表 项 ， 由 此 开始 ， 按 照 项 中 所 存储 的 指针 ， 一 
项 接 一 项 地 进行 般 历 ， 直 至 遇 到 null 指 针 。 
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图 8-9 ”链表 的 结构 


为 了 说 明 链 表 相 对 于 邻接 表 的 优势 ， 这 里 考虑 一 个 任务 一 一 删除 一 个 项 。 在 邻接 表 中 ， 删 
除 一 个 项 就 会 产生 一 个 空缺 ， 这 就 意味 着 ， 被 删除 项 的 后 续 项 必须 向 前 移动 来 保持 表 的 连续 。 
然而 ， 在 链表 的 情况 中 ， 删 除 一 个 项 只 需 改 变 一 个 指针 即 可 。 也 就 是 说 ， 将 原本 指向 被 删除 项 
的 指针 修改 成 指向 被 删除 项 后 面 的 那个 项 〈 见 图 8-10)。 这 样 一 来 ， 当 遍历 这 个 链表 时 ， 由 于 被 
删除 项 已 不 再 是 链 的 一 部 分 ， 因 而 就 会 被 忽略 。 
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删除 的 项 





图 8-10 ”从 链表 中 删除 一 个 项 





就 像 使 用 流程 图 会 导 到 杂 天 的 算法 设计 ( 见 第 )、 随意 使用 和 名 会 导致 芝 肢 的 程 

序 设计 ( 见 第 6 章 ) 一 样 ， 乱 用 指针 也 会 产生 不 必要 的 复杂 性 和 易 错 的 数据 结构 。 为 了 克服 这 
种 混乱 ， 许 多 程序 设计 语言 严格 限制 了 指针 的 灵活 性 。 例 如 ，Java 语 言 不 支持 一 般 形 式 的 指 
ge nde ds Cin 举 






saan tanh ep ei 所 人 训 被 竺 从 于 下 而 这 


条 员 则 会 用 芋 从 于 下 面条 语 的 滞 : 
将 Next 的 值 由 给 Nextt1 


注意 ，java 语 和 能 更 好 地 反映 其 根本 目标 ， 而 且 ， 为 了 执行 这 条 Java 语 自 ， 另 一 个 表 项 必须 
存在 .但 是 ， 如 果 Next 已 经 指向 了 表 中 的 最 后 一 项 ， 那 么 执行 这 条 C 语 句 ， 其 结果 将 会 造成 
Next 指 向 表 外 的 某 个 地 方 ， 这 是 C 程 序 员 新 手 甚至 经 验 丰富 的 老手 经 常 犯 的 一 个 错误 。 


在 链表 中 插入 一 个 新 项 的 工作 就 稍微 麻烦 一 点 。 首 先 要 找到 一 个 能 够 容纳 这 个 新 项 及 其 指 
针 的 未 用 存储 块 ， 然后 存 入 该 项 ， 并 将 该 项 的 指针 填 为 应 接 在 新 项 后 面 的 那个 项 的 地 址 。 最 后 ， 
修改 该 新 项 的 前 一 项 的 指针 ， 令 其 指向 新 项 〈 见 图 8-11)。 做 了 这 样 的 修改 后 ， 每 次 遍历 链表 的 
时 候 ， 就 能 在 合适 的 位 置 找到 新 项 。 





图 8-11 向 链表 中 插入 一 个 项 


8.3.4 存储 栈 和 队列 


为 了 存储 栈 和 队列 ， 通 常 采 用 一 种 类 似 于 邻接 表 的 存储 方式 。 就 栈 而 言 ， 所 预 留 的 存储 块 
的 大 小 要 足够 容纳 其 大 小 达到 最 大 时 的 栈 。( 确 定 这 个 存储 块 的 大 小 ,往往 很 关键 。 如 果 预 留 的 
空间 太 小 ， 则 栈 可 能 会 超出 所 分 配 的 存储 空间 ;， 然而， 如 果 预 留 的 空间 太 多 ， 则 会 浪费 存储 空 
间 。) 将 这 个 存储 块 的 一 端 指定 为 栈 底 ， 压 入 栈 的 第 一 个 项 就 存储 在 这 里 。 于 是 ， 再 入 栈 的 项 就 
放 在 其 上 一 个 入 栈 的 项 的 旁边 ， 这 样 一 来 ， 栈 就 向 着 预 留 块 的 男 一 端 生长 。 

注意 , 在 项 入 栈 和 出 栈 时 ， 栈 项 的 位 置 会 在 预 留 的 存储 块 中 来 回 移动 。 为 了 跟踪 这 个 位 置 ， 
栈 顶 地 址 会 存储 在 一 个 额外 的 称 为 栈 指针 (stack pointer) 的 存储 单元 中 。 也 就 是 说 ， 栈 指针 是 
指向 栈 项 的 指针 。 

如 图 8-12 所 示 ， 整 个 栈 系统 是 这 样 工 作 的 : 为 了 向 栈 中 压 入 一 个 新 项 ， 首 先 要 调整 栈 指针 ， 
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令 其 指向 正好 在 栈 顶 上 边 的 空闲 处 , 然后 将 新 项 存 栈 底 预 留 的 存储 单元 块 
放 在 这 个 位 置 。 为 了 从 栈 顶 弹出 一 个 项 ， 先 读 取 栈 ee mee 
指针 指向 的 那个 数据 , 然后 调整 栈 指针 , 令 其 指向 
栈 中 的 下 一 个 项 。 

队列 的 传统 实现 方法 类 似 于 栈 的 实现 方法 ， 也 
是 在 主 存储 器 中 预 留 一 块 连续 的 存储 单元 ， 其 大 小 
要 足够 容纳 其 大 小 达到 最 大 时 的 队列 。 然 而 ， 就 队 图 8-12 存储 器 中 的 一 个 材 
列 而 言 ， 需 要 在 队列 的 两 端 都 进行 操作 ， 所 以 不 能 像 栈 那样 只 用 一 个 指针 ， 这 里 需 预 留 两 个 存 
储 单元 用 作 指针 。 一 个 指针 称 为 头 指针 (head pointer)， 用 来 记录 队列 的 头 ， 另 一 个 指针 称 为 尾 
指针 (tail pointer)， 用 来 记录 队列 的 尾 。 当 队列 为 室 时 ， 这 两 个 指针 指向 同一 个 位 置 ( 见 图 8-13)。 
每 当 一 个 项 进入 队列 时 ， 就 将 该 项 放 在 由 尾 指 针 指 向 的 位 置 ， 然 后 修改 尾 指针 ， 令 其 指向 下 一 
个 空闲 的 位 置 。 通 过 这 种 方式 ， 尾 指针 始终 指向 队列 尾部 的 第 一 个 空闲 位 。 要 从 队列 中 移 除 一 
个 项 ， 需 要 先 读 取 头 指针 指向 的 那个 项 ， 然 后 调整 头 指针 ， 令 其 指向 队列 中 的 下 一 项 。 





供 生长 的 空间 





(a) 空 队列 (b) 插入 数据 项 A、B 和 C 之 后 
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尾 指针 


(c) 移 除 A 并 插入 D 之 后 (d) 移 除 B 并 插入 E 之 后 


图 8-13 ”用 头 指 针 和 尾 指针 实现 一 个 队列 。 注 意 看 ， 随 着 项 的 插入 和 删除 ， 
队列 是 怎样 在 存储 器 中 移动 的 

至 此 ， 所 描述 的 这 种 存储 系统 存在 一 个 问题 ， 即 随 着 项 的 插入 和 移 除 ， 队 列 会 像 冰 川 一 样 
在 内 存 中 缓慢 移动 (再 见 图 8-13)。 这 样 一 来 ， 就 需要 一 种 机 制 ， 使 队列 保持 在 预 留 的 存储 块 中 。 
这 个 问题 的 解决 办 法 很 简单 ， 就 是 让 队列 自始至终 都 在 所 分 配 的 存储 块 中 移动 。 于 是 ， 当 队 尾 
到 达 队列 的 末端 时 ， 插 入 新 项 的 操作 就 要 回 到 存储 块 的 起 始 端 进行 ， 这 时 的 起 始 端 是 空闲 的 。 
同样 ， 当 存储 块 中 最 后 一 个 项 成 为 队 首 并 被 移 除 时 ， 就 将 头 指针 调整 为 存储 块 的 起 始 端 ， 这 时 ， 
新 项 等 着 进入 队列 。 在 这 种 方式 下 ， 队 列 在 存储 块 内 按 环 状 依次 排列 ， 仿 佛 存储 块 的 尾部 被 连结 
在 一 起 ， 形 成 了 一 个 循环 〈 见 图 8-14)。 这 种 技术 所 实现 的 队列 称 为 循环 队列 〈circular queue)。 
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存储 块 中 的 
第 一 个 单元 







存储 块 中 的 


第 一 个 单元 





头 指针 几 存储 块 中 的 
最 后 一 个 单元 
头 指针 | | 尾 指 | 


尾 指针 


最 局 一 个 间 完 
(a) 实际 存储 的 队列 (b) 最 后 一 个 单元 与 第 一 个 单元 “ 相 邻 ”的 概念 上 的 存储 
图 8-14 包含 字母 P 到 字母 V 的 循环 队列 
8.3.5 ”存储 二 又 树 


为 了 讨论 树 存 储 技术 ， 这 里 将 注意 力 限 于 讨论 二 又 树 。 我 们 说 过 ， 二 叉 树 的 每 个 节点 至 多 
只 有 两 个 子 节 点 ， 它 通常 采用 类 似 于 链表 所 用 的 链接 结构 存放 在 存储 器 中 。 然 而 ， 二 又 树 的 每 
个 项 (或 称 为 节点 ) 不 是 由 两 个 元 素 〈 数 据 及 指向 下 一 个 节点 的 指针 ) 组 成 的 ， 而 是 由 三 个 元 
素 组 成 : (1) 数据 ; (2) 指向 该 节点 的 第 一 个 子 节点 的 指针 ; (3) 指向 该 节点 的 第 二 个 子 节 
点 的 指针 。 尽 管 在 机 器 中 ， 不 存在 左右 之 分 ， 但 这 里 为 了 方便 ， 就 将 第 一 个 指针 称 为 左 子 指 
针 (left child pointer)， 而 男 一 个 指针 称 为 右 子 指针 (right child pointer)， 这 样 就 可 以 方便 地 
在 纸 上 画 出 树 的 图 形 。 所 以 ， 二 又 树 的 每 个 节点 可 由 一 个 短 的 、 连 续 的 存储 单元 块 来 表示 ， 
其 格式 如 图 8-15 所 示 。 






图 8-15 ”二叉树 中 的 一 个 节点 的 结构 


要 在 存储 器 中 存储 树 ， 首 先 要 找到 可 用 的 存储 单元 块 来 存放 树 节 点 ， 然 后 依据 所 要 求 的 树 
结构 ， 将 这 些 节点 链接 起 来 。 每 个 指针 必须 设置 成 指向 其 相应 节点 的 左右 子 节点 ， 如 果树 的 某 
个 方向 不 再 有 节点 ， 则 将 相应 的 指针 赋值 为 null。( 这 也 就 说 明 ， 终 端 节点 的 特征 就 是 其 两 个 方 
向 的 指针 值 都 为 null。) 最 后 ， 留 出 一 个 专门 的 存储 位 置 ， 称 为 根 指针 (root pointer)， 用 来 存储 
根 节 点 的 地 址 。 对 树 的 访问 就 是 从 根 指针 开始 的 。 

图 8-16 所 示 的 就 是 这 样 一 种 链接 存储 系统 的 例子 ， 在 该 图 中 ， 既 画 出 了 一 个 二 又 树 的 概念 
结构 ， 又 展示 出 了 该 树 在 计算 机 存储 器 中 实际 的 存储 形式 。 可 以 看 出 ， 树 的 节点 在 主 存储 器 中 
的 实际 组 织 形 式 与 概念 上 的 组 织 形 式 有 很 大 的 不 同 。 然 而 ， 沿 着 根 指针 就 能 找到 根 节 点 ， 然 后 
随 着 相应 的 指针 ， 从 一 个 节点 到 另 一 个 节点 ， 由 上 至 下 地 遍历 树 。 

对 于 二 又 树 的 存储 ， 除 了 用 链 式 结构 外 ， 还 可 以 用 单个 的 、 连 续 存 储 单元 块 来 存储 整 棵 树 。 
利用 这 种 方法 ， 把 树 的 根 节 点 存储 在 这 个 存储 块 的 第 1 个 单元 。( 为 了 简单 起 见 ， 假 设 树 的 每 个 
节点 只 需要 一 个 存储 单元 。) 然后 ， 把 根 的 左 子 节点 存储 在 第 2 个 单元 ， 根 的 右 子 节点 存放 在 第 3 
个 单元 。 就 一 般 情况 而 言 ， 单 元 n 中 节点 的 左 、 右 子 节点 分 别 存 储 在 单元 2n 和 2n+1 中 。 在 存储 块 
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中 ， 没 有 被 树 用 到 的 单元 就 用 一 个 特别 的 位 模式 来 标识 ， 表 示 这 个 位 置 没有 数据 。 利 用 这 种 技 
术 ， 图 8-16 中 所 示 的 树 可 以 像 图 8-17 所 示 的 那样 进行 存储 。 注 意 ， 这 种 存储 系统 实际 上 是 由 上 


至 下 地 将 树 中 各 层 的 节点 作为 存储 段 来 存储 ， 一 层 接 着 一 层 。 也 就 是 说 ， 存 储 块 中 的 第 1 项 是 根 
节点 ， 接 下 来 是 根 节 点 的 子 节点 ， 然 后 是 孙子 节点 ， 以 此 类 推 。 


a 
AT 


实际 的 存储 结构 
根 指针 





图 8-16 二 又 树 的 概念 组 织 和 使 用 链接 存储 系统 实现 的 实际 组 织 形式 





概念 树 





在 树 第 2 层 在 树 第 3 层 
中 的 节点 中 的 节点 


图 8-17 ”一 棵 没 用 指针 存储 的 树 


与 前 面 所 描述 的 链接 结构 相 比 ， 这 种 存储 系统 在 查找 某 个 节点 的 父 节点 或 兄弟 节点 方面 更 
为 有 效 。 一 个 节点 的 父 节 点 的 位 置 可 以 这 样 确定 : 将 该 节点 的 位 置 除 以 2， 然 后 丢掉 余数 (如 位 
置 为 7 的 节点 ， 其 父 节 点 的 位 置 为 3 )。 一 个 节点 的 兄弟 节点 的 位 置 可 以 这 样 确定 : 如 果 该 节点 的 
位 置 为 偶数 ， 则 用 兄弟 节点 的 位 置 加 上 1; 如 果 该 节点 的 位 置 为 奇数 ， 则 用 兄弟 节点 的 位 置 减 去 
1。 例 如， 位 置 为 4 的 节点 ， 其 兄弟 节点 的 位 置 为 5;; 位 置 为 3 的 节点 ， 其 兄弟 节点 的 位 置 为 2。 而 
且 ， 当 二 又 树 接近 平衡 《也 就 是 说 ， 根 节点 下 的 两 个 子 树 具有 同样 的 深度 ) 和 完全 平衡 (也 就 
说 ， 该 树 没有 瘦长 的 分 支 ) 的 情况 下 ， 这 种 存储 系统 对 存储 空间 的 利用 更 为 有 效 。 不 过 ， 对 于 
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不 具备 这 些 特征 的 树 ， 该 系统 的 效率 就 会 变 得 非常 低 ， 如 图 8-18 所 示 。 


A 


概念 树 cage mr 


实际 的 存储 结构 
i 意 入 交 六 容 这 入 轨 和 信物 移居 第 





根 第 2 层 第 3 层 第 4 层 
图 8-18 ”一 棵 稀疏 不 平衡 树 的 概念 形式 以 及 不 用 指针 的 存储 方式 


8.3.6 ”操控 数据 结构 


我 们 已 经 看 到 ， 数 据 结构 在 计算 机 存储 器 中 的 实际 存储 方式 与 用 户 想象 的 概念 结构 是 不 同 
的 。 二 维 数组 实际 上 并 不 是 存储 在 一 个 二 维 的 矩形 存储 块 中 ， 表 或 树 实际 上 可 能 由 分 散在 较 大 
范围 的 存储 区 域内 的 小 片段 组 成 。 

所 以 ， 为 了 让 用 户 将 数据 结构 作为 一 种 抽象 工具 来 访问 ， 必 须 对 用 户 屏蔽 实际 存储 系统 的 
复杂 性 。 这 就 意味 着 ， 用 户 所 给 出 的 指令 〈 按 照 抽 象 工具 的 方式 规定 的 ) 必须 翻译 成 适合 实际 
存储 系统 操作 的 步骤 。 对 于 数组 而 言 ， 我 们 已 经 看 到 ， 翻 译 程序 如 何 利 用 地 址 多 项 式 将 行 、 列 
下 标 转化 成 存储 单元 地 址 。 具 体 来 说 ， 在 程序 员 编 写 语句 


Sales[3, 4] = 5; 


时 ， 只 将 其 作为 抽象 的 数组 来 考虑 ， 而 我 们 已 经 知道 ， 如 何 将 这 条 语句 转化 为 完成 对 主 存储 器 
进行 正确 修改 的 操作 步 又。 同样， 我 们 也 知道 ， 下 面 这 种 涉及 抽象 聚合 类 型 的 语句 


Employee.Age = 22; 


是 如 何 依据 该 聚合 的 实际 存储 情况 被 翻译 成 合适 的 操作 的 。 

在 表 、 栈 、 队 列 以 及 树 这 些 情况 中 ， 根 据 抽象 结构 定义 的 指令 通常 是 通过 函数 转化 为 相应 
操作 ， 而 这 些 函 数 在 向 用 户 屏蔽 底层 存储 系统 的 细节 的 同时 ， 还 完成 了 其 预期 的 任务 。 例 如 ， 
如 果 insert 函 数 是 用 来 向 链表 中 插入 新 项 的 ， 那 么 只 要 执行 一 个 如 下 的 函数 调用 ， 就 可 以 将 
J. W. Brown 加 入 到 Physics 208 班 的 学 生 列表 中 : 


insert ("Brown, J.W.", Physics208) 


注意 ， 这 个 过 程 调用 完全 是 依据 抽象 结构 声明 的 ， 通 过 这 种 方式 ， 可 以 把 表 的 实际 执行 过 程 隐 
藏 起 来 。 

下 面 举 一 个 更 为 详细 的 例子 ， 图 8-19 展 示 了 一 个 名 为 PrintList 的 用 来 打印 值 链表 的 函数 。 
这 个 函数 假设 称 为 Head 的 字段 指向 了 链表 中 的 第 一 项 ， 而 每 个 项 都 由 两 个 元 素 组 成 : 值 
(“Value”) 和 指向 下 一 项 (“Next”) 的 指针 。 在 这 个 图 中 ，Python 的 特殊 值 None 被 用 作 null 指 
针 。 这 个 函数 编写 好 以 后 ， 就 可 以 作为 一 个 抽象 工具 用 来 打印 链表 ， 而 无 需 关 心 打 印 链表 所 需 的 
实际 步骤 。 例 如， 要 获得 一 份 Economic 301 班 的 打印 学 生 列表 ， 用 户 只 需 执行 下 面 的 函数 调用 : 
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printList (Economics301lClassList) 


束 能 得 到 预期 结果 。 而 且 ， 如 果 以 后 我 们 想 改变 表 的 实际 存储 方式 , 那么 只 需 改 变 函 数 printList 
的 内 部 操作 : 用 户 仍然 可 以 继续 使 用 以 前 的 那个 函数 调用 来 完成 打印 操作 。 


def PrintList(List) : 
CurrentPointer = List.Head 


while (CurrentPointer != None): 
print (CurrentpPointer.Value) 
CurrentPointer = CurrentPointer.Next 





图 8-19 一 个 打印 链表 的 函数 


问题 与 练习 

1. 画 出 下 面 的 数组 是 如 何以 行 主 序 的 方式 存储 在 主 存储 器 中 的 。 
和 7 
1 41218| 
二 人 | 


2. 如 果 一 个 二 维 数组 是 以 列 主 序 的 方式 ， 而 不 是 行 主 序 的 方式 存储 的 ， 那 么 请 给 出 一 个 能 找到 该 二 维 

数组 中 第 i 行 第 j 列 元 素 的 公式 。 

3. 在 Python、C、C++、Java 以 及 C# 广 些 程 序 设 计 语 言 中 ， 数 组 的 下 标 都 是 从 0 开始 的 ， 而 不 是 从 1 开始 。 
所 以 ， 数 组 Array 第 1 行 第 4 列 的 项 可 由 Array[0] [3] 表 示 。 这 种 情况 下 ， 翻 译 程序 将 使 用 什么 样 的 
地 址 多 项 式 ， 把 azzay[i]l [j] 这 样 的 引用 格式 转化 为 存储 器 地 址 呢 ? 

. 什么 条 件 表示 链表 为 空 ? 

. 修改 图 8-19 中 的 函数 ， 使 得 其 打印 出 某 个 指定 的 名 字 之 后 就 停止 打印 。 

. 根据 本 节 提 到 的 在 一 个 连续 的 存储 单元 块 中 实现 栈 的 技术 ， 什 么 条 件 表示 栈 为 空 ? 

- 请 说 明 ， 在 高 级 语言 中 ， 怎 样 用 一 维 数组 来 实现 一 个 栈 ? 

. 如 果 一 个 队列 是 运用 本 节 描 述 的 循环 方式 实现 的 , 那么 当 队 列 为 空 时 , 头 指针 和 尾 指针 的 关系 如 何 ? 

队列 满 时 ， 关 系 又 如 何 ? 怎么 样 来 检测 队列 是 满 的 还 是 空 的 ? 

依据 本 节 所 讲 的 内 容 ，, 画 出 下 面 这 棵 树 在 采用 左 子 指针 和 右 子 指针 存储 时 ,其 在 存储 器 中 存放 的 

情况 。 然 后 ,利用 本 节 所 讲 的 树 的 另 一 种 存储 方式 ， 画 出 另 一 幅 图 ， 表示 利用 连续 存储 块 存放 时 

的 情况 。 


oo ~ 个 上 


8.4 一 个 简短 的 案例 
现在 考虑 一 个 按 字 母 顺 序 存 储 名 字 列 表 的 任务 。 假 设 要 对 这 个 列表 进行 如 下 操作 : 


搜索 (search) 一 个 项 是 否 存在 ， 
按 字母 顺序 打印 〈print) 列表 ， 
插入 (insert) 一 个 新 项 
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我 们 的 目标 是 开发 一 个 带 有 一 组 函数 的 存储 系统 来 实现 这 些 操作 ， 这 样 就 实现 了 一 个 完整 的 抽 
象 工 具 。 

首先 考虑 存储 这 个 列表 的 几 种 可 选 的 方法 。 如 果 按 照 链表 方式 来 存储 ， 就 需要 对 列表 以 串 
行 的 方式 进行 搜索 ， 在 第 5 章 中 就 讨论 过 这 样 一 个 过 程 。 如 果 列 表 很 长 ,那么 这 个 处 理 过 程 的 效 
率 就 非常 低 。 所 以 要 寻找 男 外 一 种 实现 方法 , 使 得 搜索 过 程 能 够 利用 到 二 分 搜索 算法 ( 见 5.5 节 )。 
要 利用 这 种 算法 ， 必 须 能 从 所 采用 的 存储 系统 中 找到 这 个 列表 较 小 部 分 里 的 中 间 项 。 我 们 的 解 
决 办 法 是 ， 将 列表 用 二 又 树 的 形式 进行 存储 。 首 先 让 列表 的 中 间 项 成 为 根 节点 ， 然 后 把 列表 余 
下 部 分 的 头 一 半 的 中 间 项 作为 根 节点 的 左 子 节点 ， 把 后 一 半 的 中 间 项 作为 根 节点 的 右 子 节点 。 
接 下 来 ， 将 列表 余下 的 的 每 个 四 分 之 一 部 分 的 中 间 项 再 作为 根 节点 的 子 节点 的 子 节点 ， 依 次 类 
推 。 例 如 ， 图 8-20 所 示 的 树 就 表示 了 包含 有 A、B、C、D、E、F、G、H、 I、 本 K、L 及 M 的 一 
个 字母 列表 。( 我 们 约定 ， 当 所 讨论 的 列表 的 一 部 分 有 偶数 个 项 时 ， 取 中 间 两 项 里 的 较 大 者 为 中 
间 项 。) 


Fe ee 
: Db 本 
eh / -SS / 
图 8-20 ”字母 A 到 M 排 列 成 一 个 有 序 树 


为 了 搜索 以 这 种 方式 存储 的 列表 ， 要 先 将 目标 值 与 根 节点 的 值 进行 比较 。 如 果 两 者 相 
等 ， 则 搜索 成 功 ， 如 果 它 们 不 相等 ， 则 依据 目标 值 是 小 于 还 是 大 于 根 节点 的 值 ， 转 移 至 根 
的 左 子 节 点 或 者 右 子 节点 。 这 样 我 们 就 可 以 发 现 , 继续 搜索 的 工作 只 需 在 列表 的 一 半 中 进 
行 。 这 样 的 一 种 “比较 然后 转移 至 子 节 点 ”的 过 程 会 一 直 继 续 ， 直 到 找到 目标 值 ( 说 明 搜 
索 工 作成 功 了 ) 或 者 遇 到 了 null 指 针 (None) 但 却 没有 找到 目标 值 (说 明 搜 索 工作 失败 了 ) 
为 止 。 

图 8-21 给 出 了 用 链 式 树 结构 表示 这 种 搜索 过 程 的 方式 。Python 中 的 elif 关 键 字 是 “else: 
if ...” 的 简写 。 注 意 ， 这 里 的 这 个 函数 仅仅 是 图 5-14 中 的 那个 函数 的 一 个 细 化 ， 图 5-14 
表示 的 是 二 分 搜索 算法 的 原始 描述 。 这 两 个 图 的 区 别 主 要 是 表面 上 的 。 原 先 描 述 的 算法 是 
对 列表 的 相继 变 小 的 片段 进行 搜索 ， 而 这 里 描述 的 算法 是 对 相继 较 小 的 子 树 进行 搜索 ( 见 
图 8-22 )。 


def Search (Tree, TargetValue): 
if (Tree is None): 
return None # Search failed 
elif (TargetValue == Tree.Value): 
return Tree # Search succeeded 
elif (TargetValue < Tree.Value): 
# Continue search in left subtree. 
return Search (Tree.Left, TargetValue) 
elif (TargetValue > Tree.Value): 
# Continue search in right subtree. 


return Searchl(Tree.Right, TargetValue) 





图 8-21 二 分 搜索 用 于 作为 链 式 二 又 树 实现 的 列表 
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图 8-22 ”利用 图 8-21 中 的 函数 搜索 字母 J 所 涉及 的 相继 变 小 的 树 


当 把 “列表 ”存储 为 二 又 树 时 ， 你 可 能 会 认为 ， 现 在 按照 字母 顺序 打印 这 个 列表 的 过 程 变 难 了 。 
然而 ， 要 按照 字母 顺序 打印 这 个 列表 ， 只 需要 先 按 字 母 顺序 打印 出 左 子 树 ， 然 后 打印 出 根 节点 ， 接 
下 来 再 按 字 母 顺序 打印 出 右 子 树 即 可 〈 见 图 8-23 )。 因 为 ， 左 子 树 所 包含 的 元 素 都 小 于 根 节 点 的 值 ， 
而 右 子 树 所 包含 的 元 素 都 大 于 根 节点 的 值 。 到 目前 为 止 ， 该 算法 的 逻辑 框架 如 下 所 示 : 

if ( 树 非 空 ) : 

按照 字母 顺序 打印 左 子 树 


打印 根 节点 
按照 字母 顺序 打印 右 子 树 





人 2 


ri 


图 8-23 ” 按 字 母 顺序 打印 一 棵 搜索 树 
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在 分 派 程序 控制 下 运行 的 任何 进程 ， 在 给 其 分 配 的 存储 空间 中 也 需要 执行 垃圾 回收 工作 。 

垃圾 回收 涉及 一 些 难 以 捉摸 的 问题 . 对 于 链 式 结构 , 每 当 一 个 指向 数据 项 的 指针 改变 时 ， 
垃圾 回收 程序 必须 决定 是 否 要 回收 指针 原先 指向 的 那个 存储 空间 。 在 涉及 多 路 径 指针 交叉 的 
数据 结构 中 ， 这 种 问题 就 尤为 复杂 。 不 准确 的 垃圾 回收 例 程 会 导致 数据 丢失 ， 或 者 存储 空间 
的 利用 率 较 低 。 例 如 ， 如 果 垃 圾 回收 操作 不 能 成 功 地 回收 存储 空间 ， 那 么 有 效 的 存储 空间 就 
会 越 来 越 小 ， 这 种 现象 称 为 内 存 泄露 (memory leak). 


这 个 框架 中 包含 按照 字母 顺序 打印 左 子 树 和 右 子 树 这 两 项 任务 ， 这 两 项 任务 本 质 上 是 原始 
打印 任务 的 缩小 版 本 。 也 就 是 说 ， 打 印 一 棵 树 涉 及 打印 子 树 的 任务 ， 这 就 使 人 想到 运用 递归 方 
法 来 解决 我 们 这 棵 树 的 打印 问题 。 

依据 这 个 思路 ， 可 以 把 原先 的 设想 扩展 为 一 个 完整 的 打印 二 又 树 的 Python 函数 ， ss 
所 示 。 这 里 ， 将 该 函数 命名 为 PrintTree， 然 后 再 调用 PrintTree 来 打印 左 子 树 和 右 子 树 。 

意 ， 递 归 过 程 的 终止 条 件 ( 遇 到 一 个 null 子 树 ,“None”) 肯定 能 达成 ， 因为 在 因数 过 二 的 起 
活动 中 ， 每 次 递归 所 操作 的 树 都 要 比 启动 这 个 递归 活动 的 那 棵 树 要 小 。 








def PrintTree (Tree) : 
if (Tree != None) : 


PrintTree (Tree.Left) 
print (Tree.Value) 
PrintTree (Tree.Right) 





图 8-24 用 于 打印 二 又 树 中 数据 的 函数 


在 树 中 ， 插 入 一 个 新 项 的 任务 比 起 初 看 起 来 的 也 要 容易 。 赁 直觉 也 许 会 认为 ， 插 入 新 项 只 
需 先 将 树 切 开 ， 为 新 项 留 出 空间 ， 但 实际 上 ,不 论 要 
添加 的 节点 的 值 如 何 ， 总 是 可 以 作为 一 个 新 的 叶子 节 
点 插入 到 树 中 。 为 了 给 新 项 找到 合适 的 位 置 , 要 沿 着 
搜索 该 项 时 所 遵循 的 那 条 路 径 往 下 走 。 由 于 该 项 并 不 
在 树 中 ， 所 以 我 们 最 终 会 遇 到 一 个 
位 置 就 是 存放 新 节点 的 合适 位 置 ( 见 图 8-25)。 事 实 
上 ， 这 就 是 搜索 新 项 时 会 到 达 的 位 置 。 

对 于 链 式 树 结构 ， 表 达 这 个 过 程 的 函数 如 图 8-26 所 
示 。 它 首先 在 树 中 搜索 要 插入 的 值 〈 称 为 NewValue )， 
然后 把 包含 有 NewValue 的 一 个 新 叶子 节点 放 到 相 











(a) 搜索 新 项 直到 检测 到 它 不 存在 


应 的 位 置 。 注意 , 如 果 在 搜索 过 程 中 发 现 要 插入 的 项 
已 经 在 树 中 ， 则 不 进行 插入 操作 。 图 8-26 中 的 Python 一 Db 
代码 使 用 函数 调用 TreeNode () 创建 了 一 个 新 聚合 ， 
用 作 这 个 链 式 柑 结构 的 一 个 新 叶子 节点 。 这 需要 图 。 A SS bp 
中 没有 的 额外 代码 来 把 TreeNode 标 识 为 用 户 定义 
的 类 型 ， 用 户 定义 的 类 型 将 在 下 节 中 介绍 。 # 了 
可 以 得 出 这 样 一 个 结论 : 包含 了 链 式 二 叉 树 结构 
以 及 用 于 搜索 、 打 印 、 插 入 操作 的 这 些 函数 的 软件 包 (b) 这 就 是 新 项 所 应 存放 的 位 置 


提供 了 一 个 完整 的 包 ， 该 包 可 以 作为 我 们 假想 应 用 的 ” 图 8-25 把 项 M 插 入 到 由 B、E、G、H、 J 
一 个 抽象 工具 。 事 实 上 ， 如 果实 现 恰当 , 用 户 在 使 用 K、N、P 组 成 的 以 树 结构 存储 的 列表 中 
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这 个 软件 包 时 就 无 需 关 心底 层 的 实际 存储 结构 。 利 用 软件 包 中 的 过 程 ， 用 户 可 以 想象 名 字 列 表 
是 按 字母 顺序 存储 的 ， 而 事实 上 ， 这 些 “ 列 表 ” 项 分 散在 不 同 的 存储 单元 块 中 ， 链 接 成 了 一 个 
二 叉 树 。 


def Insert (Tree, NewValue): 
if (Tree is None): 
# Create a new leaf with NewValue 
Tree = TreeNode () 
Tree.Value = NewValue 
elif (NewValue < Tree.Value) : 
# Insert NewValue into the left subtree 


Tree.Left = Insert (Tree.Left, NewValue) 
elif (NewValue > Tree.Value): 

# Insert NewValue into the right subtree 

Tree.Right = Insert (Tree.Right, NewValue) 
else: 

# Make no change. 
return Tree 





图 8-26 一 个 用 于 向 二 叉 树 存储 的 列表 中 插入 新 项 的 函数 


问题 与 练习 

1. 画 一 个 三 叉 树 ， 可 以 用 来 存储 由 R、S、T、U、V、W、X、Y 和 Z 组 成 的 列表 ， 以 备 将 来 搜索 之 用 。 

2. 简要 说 明 ， I M0 nt a 
路 径 又 是 怎样 的 ? 
3. 画 一 个 图 ,， 表示 将 图 8.24 中 的 闻 扫 打印机 贡 法 用 在 图 8.20 中 的 有 序 树 中 打印 K 节 点 时 的 活动 状态 。， 个 

。 一 个 树 结构 ， 它 的 每 个 节点 有 26 个 子 节点 。 试 W 关 双 衬 了 小 站 交趾 到 所 对 甘 庆 中 本 下 而 的 调 下 寺 
行 编码 的 。 \ 


8.5 ”定制 的 数据 类 型 


在 第 6 章 中 ， 我 们 介绍 了 数据 类 型 的 概念 ， 并 讨论 了 几 种 基本 数据 类 型 ， 如 整 型 、 浮 
点 型 、 字 符 型 及 布尔 型 。 大 多 数 程序 设计 语言 都 提供 了 这 些 基本 数据 类 型 。 此 外 ， 为 了 更 
好 地 满足 某 个 具体 应 用 的 需要 ， 程 序 员 会 定义 一 些 自己 的 数据 类 型 ， 本 节 将 考虑 几 种 定义 
方式 。 


8.5.1 用 户 定义 的 数据 类 型 


如 果 除 了 程序 设计 语言 中 提供 的 那些 基本 数据 类 型 以 外 ， 还 有 其 他 数据 类 型 可 用 ， 那 么 表 
达 一 个 算法 一 般 就 会 变 得 比较 容易 。 基 于 这 种 原因 ， 现 代 的 许多 程序 设计 语言 都 允许 程序 员 利 
用 基本 数据 类 型 作为 构件 块 ， 定 义 一 些 附加 的 数据 类 型 。 这 些 “ 自 制 ” 数 据 类 型 中 最 基本 的 例 
子 被 称 为 用 户 定义 的 数据 类 型 (user-defined data type)， 其 本 质 就 是 几 个 基本 数据 类 型 组 合 而 成 
的 具有 同一 名 字 的 聚合 体 (conglomerate ) 。 

为 了 对 此 进行 解释 ， 这 里 假设 要 开发 一 个 涉及 许多 变量 的 程序 ， 而 每 个 变量 都 有 相同 的 聚 
合 结构 ， 都 由 名 字 、 年 龄 以 及 技能 级 别 组 成 。 一 种 方法 是 将 每 个 变量 分 别 定义 成 聚合 类 型 〈 见 
6.2 节 )。 然 而 ， 更 好 的 办 法 是 将 这 个 聚合 定义 成 一 种 新 的 《用户 定义 的 ) 数据 类 型 ， 然 后 就 把 
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这 种 新 的 数据 类 型 作为 一 种 基本 类 型 来 使 用 。 
回顾 6.2 节 中 的 一 个 例子 ， 在 C 语 言 中 ， 语 句 
struct 
{ 
char Name[25]; 
int Age; 
float SkillRating; 
} Employee; 
定义 了 一 个 称 为 mployee 的 新 聚合 ， 其 中 包含 三 个 字段 Name (字符 型 )、Age ( 整 型 ) 和 
SkillRating ( 浮 点 型 )。 
与 此 相反 ，C 语 句 
struct EmployeeType 
{ 
char Name[25]; 
int Age; 
float SkillRating; 
}; 
并 没有 定义 新 聚合 变量 ， 而 是 定义 了 一 个 新 聚合 类 型 EmployeeType。 这 样 一 来 ， 就 可 以 采用 
与 基本 数据 类 型 相同 的 变量 声明 方式 ， 用 这 个 新 的 数据 类 型 来 声明 变量 了 。 也 就 是 说 ，C 语 言 
允许 用 语句 


nt 其 ? 


将 变量 x 声明 为 整数 。 同 样 ， 变 量 Employeel 也 可 以 采用 下 列 语句 来 声明 为 EmployeeType 类 型 : 


struct EmployeeType Employeel; 


于 是 ， 在 以 后 的 程序 中 ， 变 量 Employee1l 就 将 引用 一 整 块 存储 单元 ， 该 存储 块 中 包括 员工 
的 名 字 、 年 龄 和 技能 级 别 。 存 储 块 中 的 各 个 项 可 以 通过 诸如 Employeel .Name 和 Employeel .Age 
这 样 的 表达 式 来 引用 。 所 以 ， 语 句 


Employeel.Age = 26; 


会 被 用 来 将 值 26 赋 给 Employeel 块 中 的 ge 字段。 而 且 ， 语 名 

struct EmployeeType DistManager, SalesRepl, SalesRep2; 

可 以 用 来 将 3 个 变量 DistManager、SalesRepl 和 SalesRep2 声 明 为 EmployeeType 类 型 ， 就 
像 下 列 形式 的 语句 通常 被 用 作 将 变量 Sleeve、Waist、Neck 声 明 为 基本 的 float 类 型 : 

float Sleeve, Waist, Neck; 

分 清 用 户 定义 的 数据 类 型 与 这 个 类 型 的 一 个 实际 项 之 间 的 区 别 非 常 重要 。 后 者 称 为 数据 类 型 
的 一 个 实例 (instance)。 用 户 定 义 的 数据 类 型 本 质 上 就 是 一 个 用 来 构建 数据 类 型 实例 的 模板 。 该 
模板 描述 了 这 种 类 型 的 所 有 实例 所 具有 的 属性 , 但 是 它 本 身 并 非 这 种 类 型 的 一 个 实例 (这 就 好 比 ， 
饼干 成 型 切割 刀 是 做 饼干 的 模板 , 但 其 本 身 不 是 饼干 )。 在 上 面 的 例子 中 ,用户 定义 的 数据 类 型 
EmployeeType 构 建 了 三 个 该 类 型 的 实例 


8.5.2 抽象 数据 类 型 
在 许多 程序 设计 语言 里 ， 用 户 定义 的 数据 类 型 《如 C 语 言 的 结构 和 Pascal 语 言 的 记录 ) 都 扮 





DistManager、SalesRepl 和 SalesRep2。 
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演 着 重要 的 角色 ， 帮 助 软件 设计 者 调整 数据 表示 以 满足 特定 程序 的 需要 。 然 而 ， 传 统 的 用 户 定 
义 的 数据 类 型 仅 允许 程序 员 定义 新 的 存储 系统 ， 而 没有 提供 对 具有 这 些 结构 的 数据 进行 处 理 的 
操作 。 

抽象 数据 类 型 (Abstract Data Type，ADT) 是 一 种 用 户 定义 的 数据 类 型 ， 可 以 同时 包 
插 数据 表示) 和 函数 〈 行 为 )。 支 持 抽象 数据 类 型 创建 的 程序 设计 语言 通常 都 有 两 个 特 
性 : (1) 具有 “用 于 将 抽象 数据 类 型 定义 为 一 个 单个 单元 ”的 语法 ; (2) 具有 “将 抽象 数 
据 类 型 的 内 部 结构 隐藏 起 来 ， 不 让 程序 的 其 他 部 分 利用 ”的 隐藏 机 制 。 第 一 个 特性 是 一 个 
重要 的 组 织 工具 ， 它 能 将 抽象 数据 类 型 的 数据 和 函数 组 织 在 一 起 ， 简 化 维护 和 调试 。 第 二 
个 特性 提供 了 可 靠 性 ， 它 能 阻止 抽象 数据 类 型 以 外 的 其 他 代码 访问 其 数据 ， 无需 专门 的 提 
供 可 靠 性 的 函数 。 

为 了 对 此 进行 说 明 ， 这 里 假设 要 在 一 个 程序 中 创建 和 使 用 几 个 整数 栈 。 其 方法 可 以 是 ， 将 
每 个 栈 实 现成 一 个 有 20 个 整数 值 的 数组 。 将 栈 底 的 项 放 在 〈 压 入 ) 数组 的 第 一 个 位 置 ， 将 栈 的 
其 他 项 相继 放 在 〈 压 入 ) 数组 的 高 位 项 处 〈 见 8.3 节 的 问题 与 练习 7)。 再 用 一 个 整 型 变量 作为 栈 
指针 ， 用 来 存放 数组 项 的 下 标 ， 而 下 一 个 栈 项 将 会 被 压 入 到 该 数组 中 。 因 此 ， 每 个 栈 都 由 一 个 存 
放 栈 本 身 的 数组 和 一 个 起 着 栈 指针 作用 的 整数 组 成 。 

为 了 实现 这 个 构想 ， 首 先 要 用 下 列 形式 的 C 语 名 来 建立 一 个 称 为 StackTyPe 的 用 户 定义 的 
类 型 : 

struct StackType 

int StackEntries[20]; 

int StackPointer = 0; 

}; 

(回顾 一 下 ， 在 一 些 语言 中 ， 如 C、C++、C# 及 Java， 数 组 stackEntries 的 下 标 范围 也 是 0~19， 
因此 这 里 将 StackPointez 的 值 初始 值 初 始 为 0。) 做 了 这 个 声明 之 后 ， 我 们 就 可 以 通过 下 列 语 
句 来 声明 称 为 Stackone、StackTwo 和 StackThzree 的 栈 ; 





struct StackType StackOne, StackTwo, StackThree; 


此 时 ， 变 量 Stackone、StackTwo 和 StackThree 中 的 每 一 个 都 可 以 引用 一 个 唯一 的 存储 
单元 块 ， 用 以 实现 各 自 的 栈 。 但 是 ， 如 果 现 在 要 把 25 这 个 值 压 入 到 Stackone, 该 怎么 办 呢 ?” 当 
然 ， 我 们 希望 能 屏蔽 掉 以 栈 的 实现 为 基础 的 数组 结构 的 细节 ， 而 仅仅 将 栈 作 为 一 种 抽象 工具 来 
使 用 ， 即 可 能 会 用 类 似 于 


push(25, StackOne); 


这 样 的 一 个 函数 调用 。 但 是 ， 如 果 不 定义 称 为 push 的 相应 函数 ， 这 样 的 一 条 语句 就 不 可 用 。 我 
们 想 对 StackType 类 型 的 变量 进行 的 其 他 操作 有 : 从 栈 中 弹出 项 、 检 查 栈 是 否 为 空 以 及 检查 栈 是 
否 已 满 。 所 有 这 些 操作 都 要 求 定义 相应 的 函数 。 简 而 言 之 ， 我 们 定义 的 StackType 数 据 类 型 并 不 
包括 我 们 想 让 这 个 类 型 关联 的 所 有 特性 。 此 外 , 程序 里 的 任何 函数 都 有 可 能 访问 StackType 变 量 
的 StackPointer 字 段 和 StackEntries 字 段 ， 绕 开 我 们 设计 到 函数 push 和 pop 中 的 仔细 检查 。 
程序 男 一 部 分 中 的 草率 的 赋值 语句 会 重 写 存储 在 栈 数据 结构 中 间 的 数据 元 素 ， 甚 至 会 破坏 所 有 
栈 共有 的 一 个 特性 一 一 后 进 先 出 行为 。 

我 们 所 需要 的 是 一 种 机 制 ， 既 能 定义 允许 对 StackType 进 行 的 操作 ， 又 能 保护 内 部 
变量 不 被 外 部 引用 。Java 语 言 的 ijnterface 语 法 就 是 这 种 机 制 。 例如， 在 Java 中 ， 可 以 这 
样 写 : 
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interface StackType 

{ 
public int pop(); /* Return the item at top of stack */ 
public void Push (int item); /* Add a new item to stack */ 
public boolean isEmpty(); /* Check if stack is emtpy */ 
public boolean isFull(); /* Check if stack is full */ 

} 


单独 来 讲 ， 这 个 抽象 数据 类 型 没有 指定 如 何 存 储 栈 ， 或 者 用 什么 算法 来 执行 Push 函数 、PoP 函 
数 、isEmpty 函 数 以 及 isFul1 函 数 。 这 些 细节 【〔〈 已 被 这 个 interface 抽 和 象 出 来 ) 会 被 其 他 Java 
代码 在 其 他 地 方 指定 。 然 而 ， 像 我 们 前 面 的 用 户 定 义 的 数据 类 型 一 样 ， 程 序 员 能 把 变量 或 函数 
参数 声明 为 StackType 类 型 的 。 

我 们 可 以 用 下 面 的 语句 把 Stackone、StackTwo 和 StackThree 声 明 为 栈 : 


StackType StackOne, StackTwo, StackThree; 


之 后 ， 在 程序 中 (这 三 个 变量 开始 是 null 引 用 ， 在 使 用 前 必须 用 具体 的 Java 类 实例 化 一 一 但 我 们 
这 里 不 关心 这 些 细节 )， 我 们 可 以 用 下 面 这 样 的 语句 将 这 些 项 压 入 到 这 些 栈 中 : 


Stackone .Push (25) 


该 语句 表示 用 值 25 作 为 实际 参数 ， 执 行 与 Stackone 相 关联 的 push 函 数 。 

相对 于 那些 更 为 基本 的 用 户 定义 的 数据 类 型 而 言 ， 抽 象 数据 类 型 就 是 完整 的 数据 类 型 。 
在 20 世 纪 80 年 代 , 抽象 数据 类 型 在 Ada 等 语言 中 的 出 现 , 代表 着 程序 设计 语言 在 设计 方面 前 进 
了 一 大 步 。 今天， 面向 对 象 语言 提供 了 称 为 类 的 抽象 数据 类 型 的 扩展 版 本 ， 在 下 一 节 中 将 会 
介绍 到 。 


问题 与 练习 

1. 数据 类 型 与 该 数据 类 型 的 一 个 实例 之 间 的 区 别 是 什么 ? 
2. 用 户 定义 的 数据 类 型 与 抽象 数据 类 型 之 间 的 区 别 是 什么 ? 
een ep do ea edn 

4. 请 描述 一 种 用 来 实现 支 划 账户 的 抽象 数据 类 型 。 





8.6 ”类 和 对 象 


在 第 6 章 中 我 们 讨论 过 , 面向 对 象 范 型 使 得 系统 可 由 称 为 对 象 的 单元 组 成 ,这些 对 象 通过 彼 
此 交互 来 完成 任务 。 每 个 对 象 都 是 一 个 实体 ， 能 响应 来 自 其 他 对 象 的 消息 。 对 象 由 称 为 类 的 模 

在 许多 方面 ， 这 些 类 实际 上 就 是 抽象 数据 类 型 〈 它 们 的 实例 称 为 对 象 ) 的 描述 。 例 如 ， 
图 8-27 展 示 了 ，Java 语 言 和 C#i 语 言 是 如 何 定义 StackOofIntegers 类 的 。( 在 C++ 语言 中 ， 等 价 类 
的 定义 具有 相同 的 结构 ， 但 在 语法 上 稍微 有 所 不 同 。) 注意 ， 这 个 类 为 每 一 个 在 抽象 数据 类 型 
StackType 中 声明 的 函数 都 提供 了 一 个 体 。 此 外 ， 这 个 类 包括 一 个 称 为 StackEntries 的 整 型 数 
组 ， 以 及 一 个 用 来 确定 数组 中 栈 顶 位 置 的 整数 StackPointer。 

在 Java 或 C# 程 序 中 ， 可 以 利用 这 个 类 作为 模板 ， 用 以 下 语句 来 创建 一 个 名 为 Stackone 的 
对 象 : 


StackType Stackone = new StackOofIntegers () 
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或 者 在 C++ 程序 中 ， 用 以 下 语句 来 创建 该 对 象 : 
StackOfIntegers Stackone () ; 
之 后 ， 在 程序 中 ， 使 用 以 下 语句 ， 可 以 将 值 106 压 入 到 Stackone 栈 中 : 


Stackone.push (106); 


或 者 用 下 面 的 语句 把 Stackone 的 栈 顶 元 素 读 取 到 变量 Oldvalue 中 : 


OldValue = StackOne.pop(); 


class StackOfIintegers implements StackType 
{ 
private int[] StackEntries = new int[20]; 
private int StackPointer = 0; 


Public void Push(int NewEntry) 
{ if (StackPointer < 20) 
StackEntries[StackPointer++] = NewEntry; 


} 


public int pop() 
{ if (StackPointer > 0) return StackEntries[--StackPointer]; 
else return 0; 


} 


public boolean isEmpty() 
{ return (StackPointer == 0); } 


public boolean isFull() 
{ return (StackPointer >= MAX); } 





图 8-27 Java 和 C# 语 言 中 实现 的 整数 栈 


这 些 特 征 与 抽象 数据 类 型 的 那些 特征 本 质 上 是 一 样 的 。 不 过 ， 类 与 抽象 数据 类 型 之 间 还 是 
有 些 区 别 的 。 前 者 是 后 者 的 扩展 。 例 如 ， 我 们 在 6.5 节 中 介绍 过 ， 面 向 对 象 语言 允许 类 从 其 他 的 
类 继承 属性 ， 并 包括 称 为 构造 函数 的 特殊 方法 ， 当 创建 对 象 时 ， 用 其 来 定制 个 性 化 的 对 象 。 而 
且 ， 类 会 有 不 同 程度 的 封装 性 〈 见 6.5 节 )， 这 样 就 可 以 避免 其 实例 的 内 部 属性 受 非 正常 的 访问 ， 
同时 暴露 其 他 字段 给 外 部 访问 。 





ry 


最 后 可 以 得 出 结论 : 类 和 对 象 的 概念 体现 了 程序 中 数据 抽象 的 表示 技术 又 前 进 了 一 大 . 
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步 。 事实 上 , 正 是 由 于 这 种 以 方便 的 方式 来 定义 和 使 用 抽象 的 能 力 , 才 有 了 面向 对 象 设计 范 
型 的 流行 。 


问题 与 练习 


1. 抽象 数据 类 型 与 类 在 哪些 方面 类 似 ? 在 哪些 方面 存在 着 不 同 ? 
2. 类 与 对 象 有 什么 不 同 ? 
3. 请 描述 一 个 类 ， 要 求 用 该 类 作为 构建 整数 队列 类 型 对 象 的 模板 。 





+8.7 机 器 语言 中 的 指针 


本 章 已 经 介绍 过 指针 ， 并 介绍 了 如 何 利 用 指针 来 构建 数据 结构 。 本 节 将 讨论 如 何在 机 器 语 
言 中 处 理 指针 。 

假设 我 们 要 用 附录 C 中 描述 的 机 器 语言 写 一 个 程序 ， 从 图 8-12 所 示 的 栈 中 弹出 一 个 项 , 然后 
将 其 放 入 到 一 个 通用 寄存 器 中 。 换 名 话说 ， 就 是 要 将 含有 栈 顶 项 的 存储 单元 中 的 内 容 加 载 到 一 
个 寄存 器 中 。 我 们 的 机 器 语言 提供 了 两 条 用 于 加 载 寄 存 器 的 指令 : 一 条 是 用 操作 码 2， 另 一 条 是 
用 操作 码 1。 回 想 一 下 ， 在 操作 码 2 的 情况 中 ， 操 作 数字 段 包含 了 要 加 载 的 数据 ， 而 在 操作 人 码 1 
的 情况 中 ， 操 作 数 字段 则 包含 了 要 加 载 的 数据 的 地 址 。 

由 于 不 知道 内 容 会 是 什么 ， 所 以 用 操作 码 2 达 不 到 目标 。 而 且 ， 不 知道 地 址 会 是 什么 ， 也 不 
能 用 操作 码 1。 毕 竟 ， 在 程序 执行 的 时 候 ， 栈 顶 的 地 址 会 发 生变 化 。 不 过 ， 我 们 知道 栈 指 针 的 地 
址 。 也 就 是 说 ， 知 道 所 要 加 载 的 数据 的 地 址 的 位 置 。 于 是 ， 我 们 需要 的 就 是 第 3 个 用 于 加 载 寄 存 
器 的 操作 码 ， 其 中 ， 操 作 数 字段 包含 了 指向 要 加 载 的 数据 指针 的 地 址 。 

为 了 实现 这 个 目标 ， 我 们 对 附录 C 中 的 机 器 语言 进行 扩展 ， 使 其 包含 操作 码 D。 使 用 这 个 操作 
码 的 指令 的 形式 可 能 是 DRXY， 表 示 将 地 址 为 XY 的 存储 单元 的 内 容 加 载 到 寄存 器 R 中 〈 见 图 8-28 )。 
所 以 ， 如 果 栈 指针 在 地 址 AA 的 存储 单元 中 ， 指 令 D5AA 就 能 将 栈 项 的 数据 加 载 到 寄存 器 5 中 了 。 
CPU 主 存储 器 
i 1 Mae “存放 在 地 址 


3 | Wh 说 . 存放 在 
寄存 器 5 | 在 存储 器 的 ”| AA 中 的 指针 
-指令 寄存 器 局 
EI 和 < 2 














指针 指示 数 
“ 据 的 位 置 





在 机 器 周期 的 执 
行 阶段 传送 给 寄 
存 器 的 数据 


图 8-28 利用 指针 扩展 附录 C 中 机 器 语言 的 首次 尝试 
然而 ， 这 条 指令 并 没有 完成 出 栈 操作 。 我 们 还 必须 将 栈 指 针 减 1， 以 便 让 它 指向 新 的 栈 顶 。 
这 也 就 是 说 ， 在 加 载 指令 之 后 ， 机 器 语言 程序 还 必须 将 栈 指针 加 载 到 一 个 寄存 器 中 ， 将 其 减 去 1， 
然后 再 把 结果 存 回 到 存储 器 。 
如 果 不 用 存储 单元 ， 而 用 某 个 寄存 器 来 作为 栈 指针 ， 那 么 就 可 以 减少 栈 指针 在 寄存 器 与 存 
储 器 间 的 来 回 移动 。 但 是 ， 这 也 就 意味 着 必须 重新 设计 加 载 指令 ， 以 便 它 期 望 指针 在 寄存 器 中 ， 
而 不 是 在 主 存储 器 中 。 这 样 一 来 ， 我 们 就 不 用 早 些 时 候 的 那个 方案 了 ， 使 用 操作 码 D 定 义 一 条 
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指令 ， 令 其 具有 DR0S 的 形式 即 可 ， 这 就 表示 将 寄存 器 S 所 指 的 存储 单元 的 内 容 加 载 到 寄存 器 R 
( 见 图 8-29)。 于 是 , 一 个 完整 的 出 栈 操作 就 可 以 这 样 来 完成 : 在 这 条 指令 之 后 添加 一 条 指令 (或 
儿 条 指令 )， 将 存放 在 寄存 器 S 中 的 值 减 去 1。 

CPU _ 


| 指令 指示 
Ey 
寄存 器 4 ”中 的 指令 





器 存放 着 
1 指针 


图 8-29 把 存储 在 寄存 器 中 的 一 个 指针 指向 的 存储 单元 的 内 容 加 载 到 一 个 寄存 器 中 


注意 ， 要 实现 入 栈 操作 ， 还 需要 一 条 类 似 的 指令 。 所 以 ， 还 需要 对 附录 C 中 描述 的 机 器 语 
言 做 进一步 的 扩展 ， 使 其 引入 操作 码 E， 这 样 一 来 ， ER0S 形 式 的 指 令 就 表示 把 寄存 器 R 的 内 容 
存储 到 由 寄存 器 S 所 指向 的 存储 单元 中 。 同 样 ， 为 了 完成 入 栈 操作 ， 在 这 条 指令 之 后 添加 一 条 指 
令 (或 几 条 指令 )， 将 寄存 器 S 中 的 值 加 上 1。 

我 们 所 提出 的 这 些 新 的 操作 码 D 和 操作 码 E， 不 仅 说 明了 所 设计 的 机 器 语言 是 如 何 处 理 指 针 的 ， 
还 说 明了 在 最 初 的 机 器 语言 中 没有 提 到 te pas 机 器 语言 用 两 种 方式 
来 确定 一 条 指令 中 所 涉及 的 数据 。 第 一 种 方式 是 一 条 操作 码 为 2 的 指令 来 表示 。 在 这 里 ， 操 作 
数字 段 就 明确 包括 了 所 涉及 的 数据 。 本 (immediate addressing)。 确 定数 
据 的 第 二 种 方式 是 用 操作 码 为 1 和 3 的 指令 来 表示 。 在 这 里 ， 操 作 数 字段 包含 的 是 所 涉及 的 数据 的 
地 址 。 这 种 寻 址 技术 称 为 直接 寻 址 〈direct addressing)。 然 而 ， 我 们 所 提出 的 新 操作 码 D 和 E 则 表明 
还 有 另 一 种 确定 数据 的 形式 。 这 些 指令 的 操作 数字 段 包 含 的 是 数据 地 址 的 地 址 。 这 种 寻 址 技术 称 
为 间接 寻 址 (indirect addressing)。 所 有 的 这 3 种 寻 址 技术 在 今天 的 机 器 语言 中 都 是 比较 常见 的 。 


问题 与 练习 


1. 假设 附录 C 中 描述 的 机 器 语言 按照 本 节 最 后 的 建议 进行 了 扩展 。 些 外， 假设 寄存 器 8 中 的 内 容 为 模式 
DB, 而 地 址 为 DB 的 存储 单元 中 的 内 容 为 模式 CA， 并 且 地 址 为 CA 的 存储 单元 的 内 容 为 模式 A5， 请 问 : 
在 执行 了 下 面 的 每 一 条 指令 后 ， 寄 存 器 5 中 的 位 模式 是 什么 ? 

a. 25A5 b, 15CA c. D508 

2. 利用 本 节 最 后 所 描述 的 扩展 ， 写 一 段 完整 的 机 器 语言 例 程 ， 完 成 出 栈 操作 。 pe 12 所 示 的 
方式 实现 的 ， 栈 指针 在 寄存 器 FE 中 ， 并 且 ， 栈 项 出 栈 后 压 入 寄存 器 5 中 。 

3. 利用 本 节 最 后 描述 的 扩展 ， 写 一 段 程序 ， 将 从 地 址 A0 开 始 的 5 个 连续 的 存储 单元 的 内 容 复制 到 从 地 址 
B0 开 始 的 5 个 存储 单元 。 这 里 假设 程序 的 起 始 地 址 为 00。 

4. 在 本 章 中 ， 介 绍 过 一 种 DR0S 形 式 的 机 器 指令 。 假 设 将 这 个 形式 扩展 为 DRXS， 其 意义 为 把 寄存 器 S 
中 的 值 加 上 值 X， 然 后 将 结果 所 指向 的 数据 加 载 到 寄存 器 R 中 。 这 样 一 来 ， 通 过 读 取 寄 存 器 S 中 的 值 ， 
再 加 上 值 X,， 就 可 以 得 到 指向 数据 的 指针 。 寄 存 器 S 中 的 值 不 会 发 生变 化 。( 如 果 寄 存 器 F 的 内 容 为 04， 
那么 指令 DE2F 就 把 地 址 为 06 的 存储 单元 的 内 容 加 载 到 寄存 器 E 中 ， 而 寄存 器 FE 的 值 保持 04 不 变 。) 请 
问 : 这 条 指令 的 优点 是 什么 ? 如 果 一 条 指令 的 形式 为 DRTS， 即 表示 “把 寄存 器 S$ 的 值 和 寄存 器 IT 的 值 
相 加 ， 然 后 把 所 得 的 结果 所 指向 的 数据 加 载 到 寄存 器 R 中 ”， 那么 这 条 指令 又 有 什么 优点 ? 
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复习 题 





( 带 * 的 题目 涉及 选读 章节 的 内 容 。) 


kk 


LU) 


人 


CN 


一 


当下 列 数组 分 别 以 行 主 序 和 列 主 序 在 机 器 的 存 
储 器 中 存储 时 ， 画 图 说 明 该 数组 的 存储 情况 。 





. 假设 一 个 6 行 8 列 的 数组 是 按照 行 主 序 存 储 的 ， 


其 起 始 地 址 为 20〈 十 进 制 )。 如 果 数 组 中 的 每 
个 项 只 需要 一 个 存储 单元 ， 那 么 数组 中 第 3 行 
第 4 列 的 项 的 地 址 是 多 少 ? 如 果 每 个 项 需要 两 
个 存储 单元 ， 那 么 结果 又 如 何 ? 


. 假设 第 2 题 中 的 数组 是 以 列 主 序 而 不 是 以 行 主 


序 存储 的 ， 请 重新 做 第 2 题 。 


. 如 果 想 利用 传统 的 一 维 数组 来 实现 动态 列表 ， 


那么 会 带 来 怎样 的 复杂 问题 ? 


. 描述 一 种 用 来 存储 三 维 数组 的 方法 ,请问 这 里 


用 来 定位 第 ; 面 、 第 j 行 、 第 k 列 的 项 的 地 址 多 
项 式 是 什么 ? 


. 假设 字母 列表 A、B、C、D、E、F 和 G 存 储 在 


一 个 连续 的 存储 单元 块 中 。 在 保持 列表 字母 顺 
序 不 变 的 情况 下 ， 向 列表 中 插入 字母 D 需 要 进 
行 哪些 操作 ? 


. 下 列表 格 表示 的 是 计算 机 主 存储 器 中 的 一 些 存 


储 单元 的 内 容 以 及 每 个 单元 的 地 址 。 注 意 ， 其 
中 有 些 单元 包含 字母 表 中 的 字母 ， 而 每 个 这 样 
的 单元 后 面 都 跟随 一 个 空 单元 。 在 这 些 空 单元 
中 填 入 适当 的 地 址 ， 使 得 每 个 包含 字母 的 单元 
及 其 后 的 单元 一 起 ， 构 成 一 个 链表 中 的 项 ， 并 
且 该 链表 要 按 字 母 顺序 排列 。( 用 0 来 表示 null 
指针 。) 这 里 的 头 指针 包含 的 地 址 是 什么 ? 


地 址 内 容 
11 C 
12 
13 G 
14 
15 E 
16 
17 B 
18 
19 U 
20 
21 F 


8. 


0 





下 面 的 表格 代表 的 是 计算 机 主 存 储 器 中 一 个 
链表 的 一 部 分 。 链 表 中 的 每 项 由 两 个 单元 组 
成 : 第 一 个 单元 包含 的 是 字母 表 中 的 字母 ; 第 
二 个 单元 包含 的 是 指向 链表 下 一 项 的 指针 。 请 
改变 指针 , 使 字母 N 不 再 出 现在 链表 中 ; 然后 ， 
用 字母 G 代 替 字 母 N， 并 改变 相应 的 指针 ， 使 
新 字母 按 字 母 顺序 出 现在 链表 中 的 合适 位 置 。 


地 址 内 容 
30 J 
31 38 
32 B 
33 30 
34 X 
35 46 
36 N 
37 40 
38 K 
39 36 
40 P 
41 34 


. 下 面 的 表格 使 用 与 前 面 几 题 相同 的 格式 表示 


了 一 个 链表 。 如果 头 指针 包含 的 值 是 44, 那么 
这 个 链表 所 表示 的 名 字 是 什么 ? 改变 指针 , 使 


得 这 个 链表 包含 名 字 Jean。 

地 址 内 容 
40 N 
41 46 
42 I 
43 40 
44 J 
45 50 
46 E 
47 00 
48 M 
49 42 
50 A 


51 40 


. 下 面 的 哪 一 个 例 程 能 够 正确 地 将 New-Entry 


项 直接 插入 到 链表 中 名 为 Previous-Entry 
的 项 的 后 面 ? 另外 一 个 例 程 有 什么 问题 ? 
例 程 1: 


1. 将 PreviousEntry 指 针 字段 的 值 复制 到 


NewEntry 的 指针 字段 。 
2. 将 PreviousEntry 指 针 字 段 的 值 改 成 
NewEntry 的 地 址 。 


例 程 2: 
1. 将 PreviousEntry 指 针 字段 的 值 改 成 
NewEntry 的 地 址 。 


2. 将 PreviousEntry 指 针 字段 的 值 复制 到 
NewEntry 的 指针 字段 。 


. 设计 一 个 函数 , 将 两 个 链表 连接 起 来 (也 就 是 


说 , 把 一 个 链表 放 到 另 一 链表 的 前 面 ， 形 成 一 
个 链表 )。 


. 设计 一 个 函数 ,将 两 个 已 排序 的 邻接 表 合并 成 


一 个 已 排序 的 邻接 表 。 如 果 列 表 是 链 式 的 , 那 
么 结果 又 如 何 ? 


. 设计 一 个 函数 ， 对 一 个 链表 进行 反 向 排列 。 
. a 设计 一 个 算法 , 利用 栈 作为 辅助 存储 结构 ， 


以 反 序 打印 出 一 个 链表 。 

b. 设计 一 个 递归 函数 ， 在 不 显 式 使 用 栈 结构 
的 情况 下 , 完成 同样 的 任务 。 这 个 递归 的 解 
决 方案 所 涉及 的 栈 会 采用 什么 形式 ? 


. 有 时 ， 一 个 单 链表 可 以 有 两 种 不 同 的 顺序 ， 


只 要 为 每 一 项 附加 两 个 指针 , 而 不 是 一 个 指针 
即 可 。 请 填充 下 列表 格 , 使 得 通过 紧 跟 每 个 字 
母 的 第 一 个 指针 ， 就 可 以 找到 名 字 Carol; 而 
通过 紧 跟 每 个 字母 的 第 二 个 指针 ,就 可 以 按照 
字母 顺序 找到 字母 .所 表示 的 这 两 个 链表 的 头 
指针 分 别 包含 什么 值 ? 


地 址 内 容 
60 O 
61 
62 
63 © 
64 
65 
66 A 
67 
68 
69 L 


16. 下 列表 格 表 示 的 是 文中 所 讨论 过 的 ， 存 储 在 连 


22. 


23: 


ULD 


24. 


2 


kt 


2 


CN 
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续 存 储 单元 块 中 的 一 个 栈 。 如 果 这 个 栈 的 栈 底 
地 址 是 10， 而 栈 指针 包含 值 12， 那 么 ， 一 个 出 
栈 指令 取出 的 是 什么 值 ? 执行 出 栈 操作 后 , 栈 
指针 中 的 值 是 什么 ? 


地 址 内 容 
10 
11 
12 
13 
14 


加 - 团 闻 人 殉 


. 在 第 16 题 中 ， 如 果 执 行 的 指令 是 向 栈 中 压 入 字 


母 D， 而 不 是 弹出 一 个 字母 ， 那 么 请 画 出 一 个 
表格 来 显示 存储 单元 中 最 后 的 内 容 。 在 执行 入 
栈 指令 后 ， 栈 指针 中 的 值 是 什么 ? 


. 设计 一 个 函数 ， 从 一 个 栈 中 删除 栈 底 项 ， 而 栈 


中 的 其 他 项 保持 不 动 。 这 里 只 能 用 出 栈 和 入 栈 
操作 来 访问 栈 。 为 了 解决 这 个 问题 , 应 该 用 什 
么 样 的 辅助 存储 结构 ? 


. 设计 一 个 函数 ， 比 较 两 个 栈 的 内 容 。 
. 假设 给 你 两 个 栈 , 如 果 一 次 只 允许 你 从 一 个 栈 


移动 一 个 项 到 另 一 个 栈 , 那么 原始 的 数据 将 可 
能 进行 怎样 的 重 排 ? 如 果 给 你 3 个 栈 ， 那 么 会 
有 怎样 的 安排 ? 


. 假设 给 你 3 个 栈 ， 并 且 一 次 只 允许 你 从 一 个 栈 


移动 一 个 项 到 另 一 个 栈 。 设计 一 个 算法 , 把 其 
中 一 个 栈 中 的 两 个 相 邻 项 颠倒 。 

假设 要 创建 一 个 存储 名 字 的 栈 ， 其 中 名 字 的 长 
度 不 同 。 那 么 ， 为 什么 说 “把 名 字 存 储 在 分 散 
的 存储 区 域 ， 再 建立 一 个 指向 这 些 名 字 的 指针 
的 栈 ， 而 不 是 在 栈 中 存储 名 字 本 身 ” 更 有 利 ? 
队列 在 存储 器 中 是 向 其 头 部 的 方向 移动 , 还 是 
向 其 尾部 的 方向 移动 ? 

假设 要 实现 一 个 “队列 ” 该 队列 中 的 新 项 都 有 
相应 的 优先 级 。 这 样 ， 一 个 新 项 就 会 被 放 在 那 
些 优先 级 较 低 的 项 前 面 。 请 描述 一 个 实现 这 种 
“队列 ”的 存储 系统 , 并 证 明 你 的 结论 的 正确 性 。 


. 假设 队列 中 的 每 个 项 都 需要 一 个 存储 单元 , 其 


头 指 针 包含 值 11， 尾 指针 包含 值 17。 那 么 请 问 ， 
当 向 队列 中 插入 一 项 并 移 走 两 项 时 , 这 些 指针 
的 值 又 为 多 少 ? 


. a. 假 设 一 个 队列 是 以 循环 队列 的 形式 实现 的 ， 


其 状态 如 下 图 所 示 。 请 画图 表示 在 插入 字母 
G 和 R, 移 走 3 个 字母 , 再 插入 字母 D 和 P 之 后 
的 结构 。 
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28. 


29. 


30. 


b. 在 (a) 中 ,如果 在 没有 移出 任何 字母 之 前 , 就 
插入 字母 G、R、D 和 P， 那 么 会 发 生 什 么 样 
的 错误 ? 


. 在 用 高 级 语言 编写 的 一 个 程序 中 , 请 描述 一 下 


怎样 用 数组 来 实现 队列 。 

假设 有 两 个 队列 ， 一 次 只 允许 从 一 个 队列 的 
头 部 移 一 个 项 到 任何 一 个 队列 的 队 尾 。 请 设 
计 一 个 算法 ， 苏 倒 其 中 一 个 队列 中 的 两 个 相 
邻 项 。 

下 列表 格 表 示 的 是 存储 在 机 器 存储 器 中 的 一 
棵 树 。 树 的 每 个 节点 有 3 个 单元 。 第 一 个 单元 
包含 的 是 数据 (字母 ), 第 二 个 单元 包含 的 是 
指向 该 节点 左 子 节点 的 指针 ， 第 三 个 单元 包 
含 的 是 指向 该 节点 右 子 节点 的 指针 。0 值 代 
表 null 指 针 。 如 果 根 指针 的 值 是 55， 那 么 请 
画 出 这 棵 树 。 


地 址 内 容 
40 G 
41 0 
42 0 
43 X 
44 0 
45 0 
46 J 
47 49 
48 0 
49 M 
50 0 
51 0 
52 F 
53 43 
54 40 
So W 
56 46 
57 52 


下 列表 格 表 示 的 是 计算 机 主 存 储 器 中 一 个 单 
元 块 的 内 容 。 注意 , 一 些 单元 中 包含 的 是 字母 
表 中 的 字母 , 并 且 每 个 这 样 的 单元 后 面 都 跟 有 
两 个 空 单元 。 填 充 这 些 空 单元 , 使 得 这 个 存储 
块 表示 下 面 的 那 棵 树 。 这 里 用 字母 后 的 第 一 单 
元 作为 指向 左 子 节点 的 指针 ， 用 接 下 来 的 那个 
单元 作为 指向 右 子 节点 的 指针 。 用 0 表示 null 


31. 


i 


32; 


33; 


34. 


33。 


指针 。 根 指针 的 值 应 该 为 多 少 ? 


地 址 内 容 
30 人 
31 
32 
33 H 
34 
35 
36 K 
8 
38 
39 E 
40 
41 
42 G 
43 
44 
45 Pp 
46 
47 

六 二 
全 K 
E / $ 


设计 一 个 非 递 归 算 法 来 代替 图 8-21 所 示 的 递 
归 算 法 。 

设计 一 个 非 递 归 算 法 来 代替 图 8-24 所 示 的 弟 
归 算 法 。 利 用 一 个 栈 来 控制 必要 的 回 济 。 

应 用 图 8-24 中 所 示 的 打印 树 的 递归 算法 。 画图 
表示 在 打印 X 节 点 时 该 算法 的 嵌 套 活动 (以 及 
每 个 活动 的 当前 位 置 )。 

在 保持 根 节点 相同 , 且 不 改变 数据 元 素 的 物理 
位 置 的 情况 下 , 改变 第 29 题 中 树 的 指针 , 使 得 
图 8-24 中 所 示 的 树 的 打印 算法 按 字母 顺序 打 
印 出 节点 。 

如 果 下 面 的 二 又 树 不 用 指针 存储 ， 而 是 用 8.3 
节 中 描述 的 连续 存储 单元 块 来 存储 ， 那 么 请 画 
图 表示 该 二 又 树 在 存储 器 中 是 如 何 存储 的 。 


A 和 


36. 假设 如 8.3 节 中 所 描述 的 ， 用 连续 存储 单元 来 
表示 包含 值 A、B、C、D、E 和 F 的 二 又 树 。 请 
画 出 这 棵 树 的 图 。 
. 举 一 个 可 以 把 一 个 列表 (概念 结构 ) 实现 为 一 
棵 树 (实际 的 底层 结构 ) 的 例子 。 再 举 一 个 可 
以 把 一 棵 树 (概念 结构 ) 实现 为 一 个 列表 ( 实 
际 的 底层 结构 ) 的 例子 。 
文中 所 讨论 的 链 式 树 结构 包含 指针 , 这 就 使 得 访 
问 者 可 以 沿 着 树 从 父 节 点 下 移 到 子 节点 。 请 描述 
一 个 指针 系统 ， 可 以 让 访问 者 沿 着 树 从 子 节点 上 
移 到 父 节 点 。 兄 弟 节点 之 间 的 移动 又 如 何 ? 
39. 描述 一 个 适合 于 表示 国际 象棋 游戏 时 的 棋盘 
布局 的 数据 结构 。 
40. 如 果 按 照 图 8-24 所 示 的 算法 ， 判 断 下 列 几 棵 
树 , 哪 棵 树 的 节点 会 按照 字母 顺序 打印 出 来 ? 
Y WwW 
人 
区 和 2 
W x x z 


41. 修改 图 8-24 中 的 函数 ， 使 得 能 按 倒序 打印 出 
“列表 ”。 

42. 描述 一 个 可 以 用 于 存储 一 个 家 族 的 家 谱 历 史 
的 树 结构 。 对 该 树 会 进行 一 些 什 么 样 的 操作 ? 
如 果 该 树 是 用 链 式 结构 来 实现 的 , 每 个 节点 应 
该 关联 一 些 什么 样 的 指针 ? 假设 这 棵 树 就 是 
按照 你 刚才 所 描述 的 指针 , 并 以 链 式 结构 实现 
的 , 请 设计 相应 的 过 程 来 完成 你 所 定义 的 上 述 
操作 。 利用 你 设计 的 存储 系统 , 解释 一 下 如 何 
才能 找到 一 个 人 的 所 有 兄弟 。 

43. 如 果 一 棵 树 是 按 图 8-20 所 示 的 形式 存储 的 , 请 
设计 一 个 过 程 来 从 这 棵 树 中 找到 并 删除 一 个 
给 定 的 值 。 

44. 在 树 的 传统 实现 方式 中 , 构造 的 每 个 节点 都 会 为 
其 每 个 可 能 的 子 节点 分 别 留 有 指针 。 所 设计 的 这 
种 指针 的 数目 决定 了 任何 节点 所 拥有 的 子 节点 
的 最 大 数目 。 如 果 一 个 节点 的 子 节点 数目 少 于 指 
针 数 目 ， 那 么 将 有 些 指 针 简单 地 置 为 null 即 可 。 
但 是 ， 这 样 的 一 个 节点 不 可 能 拥有 比 指针 数目 更 
多 的 子 节 点 。 请 描述 一 下 ， 如 何在 不 限制 其 节点 
所 拥有 的 子 节点 数 的 情况 下 实现 一 棵 树 。 

45. 使 用 仿照 8.5 节 介绍 的 C 结 构 语 句 编写 的 伪 代 
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码 , 定义 一 个 用 户 定 义 的 数据 类 型 ， 表 示 关 于 
公司 员工 情况 (如 名 字 、 地 址 、 工 作 职 务 、 工 
资 级 别 等 ) 的 数据 。 

利用 与 图 8-27 中 的 Java 类 语法 相似 的 伪 代 码 ， 
拟定 一 个 抽象 数据 类 型 的 定义 ,表示 一 个 名 字 
列表 。 具体 来 说 , 用 什么 样 的 结构 来 包含 这 个 
列表 ? 提供 什么 样 的 函数 来 处 理 这 个 列表 ? 
(没有 必要 包括 函数 的 详细 说 明 。) 


. 利用 与 图 8-27 中 的 Java 类 语法 相似 的 伪 代 码 ， 


拟定 一 个 抽象 数据 类 型 的 定义 ， 表 示 一 个 队 

列 。 然 后 再 给 出 伪 代 码 语句 ， 说 明 如 何 创建 这 

个 类 型 的 实例 , 以 及 如 何在 这 些 实例 中 插入 和 

删除 项 。 

a， 抽象 数据 类 型 和 基本 数据 类 型 之 间 的 区 别 
是 什么 ? 

b. 抽象 数据 类 型 与 用 户 定义 的 数据 类 型 之 间 
的 区 别 是 什么 ? 

确定 用 来 表示 地 址 短 的 抽象 数据 类 型 中 可 能 

会 出 现 的 数据 结构 和 过 程 。 

确定 用 来 表示 视频 游戏 中 一 个 简单 航天 器 的 抽 

象 数据 类 型 中 可 能 出 现 的 数据 结构 和 过 程 。 





. 修改 图 8-27， 和 8.5 节 中 的 StackType 接 口 ， 


使 得 该 类 定义 的 是 一 个 队列 ， 而 不 是 栈 。 

类 与 传统 的 抽象 数据 类 型 相 比 , 在 哪个 方面 更 
通用 ? 

利用 8.7 节 最 后 描述 的 DR0S 形 式 和 ER0S 形 式 
的 指令 ， 写 一 个 完整 的 机 器 语言 例 程 ， 向 图 
8-12 中 实现 的 栈 中 压 入 一 个 项 。 这 里 假设 栈 指 
针 在 寄存 器 F 中 ， 而 要 压 入 的 项 在 寄存 器 5 中 。 
假设 链表 中 的 每 个 项 都 由 一 个 存放 数据 的 存 
储 单元 后 跟 一 个 指向 下 一 项 的 指针 构成 。 而 
且 ， 假设 一 个 存储 地 址 为 A0 的 新 项 要 插入 到 
位 置 为 B5 的 项 和 位 置 为 C4 的 项 之 间 。 利 用 附 
录 C 中 描述 的 语言 , 以 及 8.7 节 最 后 描述 的 附加 
操作 码 D 和 E， 写 一 个 机 器 语言 例 程 来 实现 这 
个 插入 操作 。 

8.7 节 所 描述 的 DR0S 形 式 的 指令 与 DRXY 形 式 
的 指令 相 比 有 什么 优势 ? 在 8.7 节 的 问题 与 练 
习 4 中 所 描述 的 DRXS 形 式 的 指令 与 DR0S 形 
式 的 指令 相 比 有 什么 优势 ? 





raat rr 





希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 。 回 答 出 这 
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些 问题 还 不 够 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

1. 假设 一 个 软件 分 析 师 设计 了 一 个 数据 组 织 方 式 , 能 在 一 个 特定 的 应 用 中 有 效 地 处 理 数 据 。 
那么 该 如 何 保护 对 这 个 数据 结构 的 权益 呢 ? 数据 结构 是 一 种 思想 表达 (好比 一 首 许 )， 因 
而 可 以 通过 版 权 来 进行 保护 ? 还 是 数据 结构 也 像 算 法 一 样 ， 钻 了 同样 的 法 律 空 子 ? 用 专 
利 法 呢 ? 

. 在 何 种 程度 上 ， 错 误 的 数据 比 没有 数据 更 糟糕 ? 

. 在 许多 应 用 程序 中 ， 栈 可 以 扩展 到 多 大 取决 于 可 用 的 存储 器 容量 有 多 大 。 如 果 可 用 空 
间 被 耗 尽 ， 那 么 所 设计 的 软件 要 能 产生 一 条 像 “ 栈 溢出 ”这 样 的 消息 并 终止 。 在 大 多 
数 场合 ， 这 种 错误 从 不 会 发 生 ， 而 且 用 户 也 从 不 会 意识 到 这 个 错误 。 但 是 ， 如 果 这 种 
错误 发 生 了 ， 并 且 丢失 了 敏感 数据 ， 那 么 谁 将 对 此 负责 ? 软件 的 开发 者 如 何 能 减轻 自 
己 的 责任 ? 

. 在 基于 指针 系统 的 数据 结构 中 ， 删 除 一 个 项 通常 是 通过 改变 指针 ， 而 不 是 擦 掉 存储 单元 
来 办 到 的 。 这 样 一 来 ， 当 链表 的 一 项 被 删除 后 ， 这 个 删除 的 项 实际 上 还 留 在 存储 器 中 ， 
直到 有 其 他 数据 需要 它 的 存储 空间 。 这 种 被 删除 的 数据 的 存在 会 产生 什么 样 的 道德 和 安 
全 方面 的 问题 ? 

. 数据 和 程序 可 以 方便 地 从 一 台 计算 机 传送 到 另 一 台 计 算 机 。 这 样 一 来 ， 一 台 机 器 上 存储 
的 内 容 就 可 以 很 容易 地 传送 给 许多 机 器 。 相 反 ， 一 个 人 要 把 知识 传 给 另 一 个 人 ， 有 时 要 
花 很 长 的 时 间 。 例 如 ， 一 个 人 要 教会 另 一 个 人 一 种 新 语言 ， 那 得 花 时 间 。 如 果 机 器 的 能 
力 开 始 挑战 人 的 能 力 ， 那 么 这 种 在 知识 传输 率 上 的 反差 将 意味 着 什么 ? 

. 利用 指针 可 以 将 相关 的 数据 在 计算 机 存储 器 中 链接 起 来 ， 其 链接 方式 使 人 联想 到 ， 信 息 
在 人 脑 中 也 是 采用 这 种 方式 关联 起 来 的 。 那 么 ， 这 样 一 种 在 计算 机 存储 器 中 的 链接 与 人 
脑 中 的 链接 有 怎样 的 相似 之 处 ?它们 的 不 同 点 是 什么 ? 如 果 尝 试 着 把 计算 机 建造 得 与 人 
脑 更 相像 ， 那 么 这 在 伦理 上 是 否 可 取 ? 

. 计算 机 技术 的 普及 是 否 已 经 产生 了 新 的 伦理 问题 ， 或 者 只 是 提供 了 一 个 新 的 环境 ， 而 在 
这 样 的 环境 之 中 ， 原 来 的 那些 伦理 学 理论 是 否 还 适用 ? 

. 假设 计算 机 科学 导论 教材 的 作者 想 用 一 些 程序 的 例子 来 说 明文 中 的 概念 。 不 过 ， 为 了 简 
明 ， 许 多 例子 必须 使 用 实际 的 专业 优质 软件 的 简化 版 本 。 作 者 知道 ， 这 些 例子 会 被 不 持 
怀疑 态度 的 读者 所 使 用 ， 并 最 终 用 到 一 些 重 要 的 软件 应 用 中 去 ， 而 这 些 应 用 更 适合 采用 
较为 健壮 的 技术 。 作 者 应 当 采 用 这 些 简化 版 的 例子 ， 即 使 因为 简化 降低 了 它们 的 价值 ， 
仍 坚持 认为 所 有 的 例子 是 健壮 的 ， 还 是 应 当 拒绝 使 用 这 些 例 子 ， 除 非 它们 在 简明 性 和 健 
壮 性 方面 都 能 得 到 保证 ? 
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9 
数据 库 系统 


米 全 据 库 是 这 样 一 个 系统 ， 它 将 一 个 庞大 的 数据 集合 转化 成 一 个 抽象 工具 ， 人 允许 用 户 以 

一 种 简便 的 方式 搜索 和 提取 相关 的 信息 项 。 本 章 将 讨论 这 个 主题 ， 另 外 还 将 讨论 一 

个 数据 挖掘 相关 和 领域 的 主题 。 数 据 挖掘 技术 是 一 种 从 庞大 的 数据 集合 和 传统 的 文件 结构 中 发 现 
隐藏 模式 的 技术 ， 它 为 今天 的 数据 库 和 数据 挖掘 系统 提供 了 许多 基本 的 工具 。 


本 章 内 容 

9.1 数据 库 基 础 *9.5 传统 的 文件 结构 

9.2 关系 模型 9.6 数据 挖 据 

*9.3 面向 对 象 数据 库 9.7 数据 库 技 术 的 社会 影响 


*9.4 维护 数据 库 的 完整 性 


当今 的 技术 已 经 能 够 存储 相当 大 量 的 数据 ， 但 是 ， 如 果 我 们 不 能 提取 与 手头 任务 相关 的 有 
用 信息 项 ， 那 么 这 样 的 数据 集合 就 是 无 用 的 。 本 章 将 研究 数据 库 系统 ， 弄 清 这 些 系统 是 怎样 利 
用 抽象 从 庞大 的 数据 集合 中 提取 出 有 用 信息 的 。 作 为 相关 主题 ， 还 要 研究 快速 发 展 的 数据 挖掘 
领域 ， 这 个 领域 的 目标 是 开发 用 于 在 数据 集合 中 确定 和 寻找 模式 的 技术 。 此 外 ， 我 们 还 将 学 习 
传统 文件 结构 的 原理 ， 因 为 它 支 撑 了 现在 的 数据 库 和 数据 挖掘 系统 。 


9.1 数据 库 基础 


数据 库 (database ) 是 指 一 种 多 维 的 数据 集合 , 之 所 以 说 是 多 维 的 ， 是 因为 在 这 种 集合 中 ， 
通过 两 个 数据 项 之 间 的 内 部 链接 ， 可 以 从 不 同 的 角度 来 获取 信息 。 这 与 传统 的 文件 系统 〈 见 
9.5 节 ) 不 同 ， 传 统 的 文件 系统 ， 有 时 也 称 为 平面 文件 (flat file)， 是 一 种 一 维 的 存储 系统 ， 即 
它 只 从 一 个 角度 来 展示 它 的 信息 。 比 如 ， 一 个 包含 作曲 家 及 其 作品 信息 的 平面 文件 ， 也 许 只 
能 提供 一 个 按 作 曲 家 组 织 的 作品 清单 ， 而 对 于 一 个 数据 库 来 说 ， 它 可 以 呈现 某 一 作曲 家 的 所 
有 作品 ， 也 可 以 是 某 一 类 音乐 作品 的 所 有 作曲 家 ， 还 可 以 是 改写 了 其 他 作曲 家 作品 的 那些 作 
曲 家 。 


9.1.1 数据 库 系统 的 重要 性 


从 历史 发 展 角 度 来 看 ， 计 算 机 广泛 应 用 到 信息 管理 领域 时 ， 每 个 应 用 都 是 作为 独立 系统 来 
实现 的 ， 都 有 一 套 自 己 的 数据 。 工 资 用 工资 单 文件 处 理 ， 人 事 部 门 有 自己 的 员工 记录 ， 库 存 通 
过 库存 文件 来 管理 。 这 就 意味 着 ， 许 多 只 是 一 个 部 门 需要 的 信息 在 整个 公司 里 会 被 复制 ， 而 许 
多 虽然 不 同 但 相互 关联 的 数据 项 却 又 存储 在 不 同 的 系统 中 。 在 这 种 背景 下 ， 数 据 库 系统 应 运 而 
生 ， 它 作为 一 种 信息 集成 的 手段 ， 通 过 特定 的 组 织 来 存储 和 维护 数据 〈 见 图 9-1)。 利 用 这 样 一 
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个 系统 ， 可 以 根据 相同 的 销售 数据 来 确定 再 进货 订单 ， 生 成 市 场 趋势 报告 ， 指 导 广 告发 放 ， 向 
最 有 可 能 积极 响应 此 种 信息 的 客户 发 布 产品 信息 ;使 得 销售 团队 取得 更 好 的 业绩 。 





a 


(b) 面向 数据 库 的 信息 系统 
图 9-1 文件 结构 与 数据 库 结 构 的 比较 


这 样 的 信息 集成 池 提 供 了 有 价值 的 资源 ， 只 要 能 通过 有 意义 的 方式 来 获取 这 些 有 效 信息 ， 
就 可 以 通过 它 做 出 管理 决策 。 因 此 ， 数 据 库 的 研究 重点 在 于 开发 一 些 技术 ， 把 数据 库 中 的 信息 
提供 给 决策 过 程 。 在 此 方面 人 们 已 经 取得 了 很 大 进展 。 如 今 ， 数 据 库 技术 与 数据 挖掘 技术 相 结 
合 ， 已 成 为 一 种 重要 的 管理 工具 ， 使 组 织 的 管理 层 从 涵盖 组 织 和 其 环境 的 各 个 方面 的 大 量 数据 
中 提取 出 相应 的 信息 。 

而 且 ， 数 据 库 系统 已 经 成 为 支撑 万 维 网 中 许多 流行 网 站 的 基础 技术 。 如 谷歌 、eBey 和 亚 马 
逊 等 站 点 的 基础 主题 是 提供 客户 端 与 数据 库 之 间 的 接口 。 为 了 响应 客户 端的 请 求 ， 服 务 器 查询 
数据 库 ， 以 网 页 的 形式 组 织 查询 结果 ， 并 把 网 页 发 送 给 客户 端 。 这 样 的 Web 接 口 已 经 使 数据 库 
技术 承担 了 一 个 新 和 角色， 数据 库 不 再 是 存储 公司 记录 的 一 种 手段 ， 而 成 为 了 公司 的 产品 。 实 际 
上 ， 通 过 结合 数据 库 技术 和 Web 接 口 ， 因 特 网 已 经 成 为 主要 的 全 球 信息 源 。 


9.1.2 ”模式 的 作用 


数据 库 技术 的 迅速 发 展 有 一 个 缺点 ， 即 潜在 的 敏感 数据 被 未 经 授权 的 人 访问 。 一 个 在 公司 
网 站 上 下 订单 的 人 ， 不 应 该 能 访问 该 公司 的 财务 数据 ， 类 似 地 ， 负 责 公司 福利 部 门 的 员工 可 能 
需要 访问 公司 的 员工 记录 ， 但 不 应 该 能 访问 公司 的 库存 或 销售 记录 。 因 此 ， 对 数据 库 中 信息 的 
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访问 控制 能 力 与 共享 它 的 能 力 同等 重要 。 

为 了 让 不 同 的 用 户 访问 数据 库 中 不 同 的 信息 ， 通 常数 据 库 系统 都 依赖 模式 和 子 模式 。 模 式 
(schema) 是 整个 数据 库 结构 的 一 个 描述 ， 数 据 库 软 件 用 它 来 维护 数据 库 。 子 模式 (subschema，) 
只 是 与 特定 用 户 需求 相关 的 那 部 分 数据 库 的 一 个 描述 。 例 如 ,一 个 大 学 数据 库 的 模式 应 当 说 明 ， 
每 个 学 生 记录 包含 的 条 目 除 了 学 生 的 学 习 成 绩 外 ， 还 有 现 阶段 的 联系 地 址 、 电 话 号 码 。 另 外 ， 
还 要 说 明 每 个 学 生 记录 要 与 其 指导 教师 的 记录 相 链 接 。 反 过 来 ， 每 个 教师 的 记录 要 包含 个 人 地 
址 、 工 作 经 历 等 。 基 于 这 种 模式 ， 要 维持 一 个 链接 系统 ， 最 终 使 得 学 生 的 信息 与 教师 的 工作 经 
历 相关 联 。 

为 了 使 大 学 的 注册 会 员 不 能 利用 这 种 链接 关系 来 访问 教师 的 专 有 信息 ， 就 必须 限制 注册 会 
员 只 能 访问 数据 库 的 子 模 式 ， 教 师 记 录 的 子 模式 描述 不 包括 工作 经 历 。 在 这 种 子 模式 下 ， 注 册 
会 员 可 以 找 出 哪个 教师 是 某 个 学 生 的 导师 ， 但 得 不 到 该 教师 的 其 他 信息 。 相 反 ， 薪 资 部 的 子 模 
式 需 要 提供 每 个 教师 的 工作 经 历 ， 但 不 需要 包括 学 生 与 导师 之 间 的 链接 关系 。 这 样 ， 薪 资 部 可 
以 修改 教师 的 工资 ， 但 却 不 能 获得 该 教师 指导 的 学 生 的 名 单 。 


9.1.3 ”数据库 管理 系统 

一 个 典型 的 数据 库 应 用 涉及 多 个 软件 层 ， 我 们 将 其 分 为 两 个 主要 的 层 : 应 用 层 和 数据 库 管 理 
层 〈 见 图 9-2)。 应 用 软件 负责 处 理 数据 库 与 用 户 之 间 的 通信 ， 它 可 能 相当 复杂 ， 用 户 通过 网 站 访 
问 数据 库 的 应 用 就 是 其 中 一 个 例子 。 在 这 种 情况 下 ， 整 个 应 用 层 包 括 遍 及 因特网 的 客户 端 和 使 
用 数据 库 满 足 客 户 端 请 求 的 服务 器 端 。 





从 应 用 角度 从 数据 库 模 型 的 从 实际 组 织 的 
看 到 的 数据 库 ” 角度 看 到 的 数据 库 角度 看 到 的 数据 库 


图 9-2 ”一 个 数据 库 实现 的 概念 层 


为 数据 库 ， 称 为 分 布 式 数据 库 ， 其 数据 驻 
在 站 信和 从 加 大 且 和 反 天 入 二 





注意 , 应 用 软件 并 不 直接 操纵 数据 库 ， 数 据 库 实 际 是 由 数据 库 管 理 系统 (Database Management 
System，DBMS ) 操纵 的 。 一 旦 应 用 软件 确定 了 用 户 所 请 求 的 操作 ， 它 就 会 利用 数据 库 管 理 系 
统 作为 抽象 工具 来 得 到 结果 。 当 请 求 是 增加 或 删除 数据 时 ， 实 际 更 改 数据 库 的 是 数据 库 管 理 系 
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统 。 当 请 求 是 检索 信息 时 ， 实 际 完成 所 需 搜 索 的 也 是 数据 库 管 理 系统 。 

应 用 软件 与 数据 库 管 理 系统 分 离 有 几 个 好 处 。 一 个 好 处 就 是 允许 构建 和 使 用 抽象 工具 ， 在 
软件 设计 中 ， 我 们 已 反复 看 到 这 个 重要 的 简化 工作 的 概念 。 如 果 数 据 库 实际 是 如 何 存 储 数据 的 
这 样 一 个 细节 被 数据 库 管理 系统 所 屏蔽 ， 那 么 应 用 软件 的 设计 就 可 以 大 大 简化 了 。 例 如 ， 在 使 
用 精心 设计 的 数据 库 管 理 系统 时 ， 应 用 软件 无 需 考虑 数据 库 到 底 是 存储 在 单 台 机 器 里 ， 还 是 像 
分 布 式 数 据 库 (distributed database) 那样 ， 分 散 存 储 在 一 个 网 络 中 的 许多 机 器 里 。 数 据 库 管 理 
系统 自己 就 能 处 理 这 些 问 题 ， 因 此 应 用 软件 可 以 直接 访问 数据 库 ， 而 不 用 关心 数据 具体 存储 在 
哪里 。 

应 用 软件 与 数据 库 管 理 系统 分 离 的 第 二 个 好 处 是 ， 这 样 的 结构 提供 了 一 种 对 数据 库 访 问 进 
行 控制 的 手段 。 通 过 规定 由 数据 库 管理 系统 来 执行 对 数据 库 的 所 有 访问 ， 数 据 库 管 理 系统 能 实 
施 由 不 同 子 模式 确定 的 限制 。 具体 来 说 , 数据 库 管 理 系 统 可 以 对 内 部 请 求 采用 整个 数据 库 模 式 ， 
但 要 求 将 每 个 用 户 使 用 的 应 用 软件 限制 在 由 该 用 户 子 模式 描述 的 范围 内 。 

把 用 户 界 面 与 实际 数据 库 操作 分 离 成 两 个 不 同 的 软件 层 的 另 一 个 原因 ， 就 是 可 以 获得 数据 
独立 性 (data independence)， 即 改变 数据 库 组 织 本 身 而 不 改变 应 用 软件 。 例 如 ， 人 事 部 需要 在 
每 个 员工 记录 中 增加 一 个 字段 ， 以 说 明 相 应 的 员工 是 否 选择 参加 了 本 公司 新 的 健康 保险 计划 。 
如 果 是 由 应 用 软件 来 直接 处 理 数据 库 ， 那 么 这 种 数据 格式 的 变更 就 要 修改 与 该 数据 库 有 关 的 所 
有 应 用 程序 。 这 样 一 来 ， 原 本 由 人 事 部 提出 的 修改 ， 可 能 就 变 成 了 ， 不 但 要 修改 薪资 程序 ， 还 
要 修改 用 于 公司 业务 通信 服务 的 邮政 标签 打印 程序 。 

应 用 软件 与 数据 库 管 理 系统 的 分 离 就 消除 了 这 种 重新 编程 的 需要 。 要 实现 一 个 单个 用 户 所 
需 的 数据 库 修改 ， 只 需要 修改 总 体 模式 以 及 涉及 这 个 变更 的 那些 用 户 的 子 模式 ;所 有 其 他 用 户 
的 子 模 式 都 保持 不 变 。 因 此 ， 基 于 没有 改变 的 子 模式 的 应 用 软件 ， 也 不 必修 改 。 


9.1.4 数据 库 模 型 


我 们 已 多 次 看 到 如 何 用 抽象 来 隐藏 内 部 复杂 性 ， 数 据 库 管理 系统 给 出 了 又 一 个 例子 。 它 
们 隐藏 了 数据 库 内 部 结构 的 复杂 性 ， 人 允许 数据 库 的 用 户 想 像 数 据 库 中 存储 的 信息 是 以 更 有 用 
的 格式 组 织 的 。 具 体 来 说 ， 数 据 库 管理 系统 包含 许多 例 程 ， 它 们 把 按 数据 库 的 概念 视图 表达 
的 命令 ， 翻 译 为 实际 数据 存储 系统 所 要 求 的 操作 。 这 种 数据 库 的 概念 视图 称 为 数据 库 模 型 
(database model ) 。 

接 下 来 的 几 节 将 讨论 关系 数据 库 模 型 和 面向 对 象 数据 库 模型 。 在 关系 数据 库 模 型 中 ， 数 据 
库 的 概念 视图 是 一 组 由 行 和 列 组 成 的 表格 。 例 如 ， 关 于 公司 员工 的 信息 可 以 看 成 这 样 的 一 个 表 
格 ， 即 每 行 表示 一 名 员工 ， 各 列 分 别 表 示 姓 名 、 地 址 、 员 工 的 工 号 等 。 于 是 ， 数 据 库 管 理 系统 
会 包含 一 些 例 程 ， 让 应 用 软件 从 表格 的 某 一 行 中 选取 某 些 项 ， 或 者 输出 工资 列 中 的 金额 范围 ， 
即使 信息 并 没有 实际 按 行 和 列 存 储 。 

这 些 例 程 构成 了 应 用 软件 用 来 访问 数据 库 的 抽象 工具 。 更 准确 地 说 , 通常 应 用 软件 用 一 
种 通用 程序 设计 语言 (这些 在 第 6 章 讨论 过 ) 来 编写 。 这 些 语言 为 算法 的 表达 提供 了 基本 元 
素 , 但 缺少 操纵 数据 库 的 指令 。 然 而 ,用 这 些 语言 编写 的 程序 可 以 把 数据 库 管理 系统 提供 的 
例 程 作为 预先 编 好 的 子 例 程 来 使 用 , 这 实际 上 扩充 了 该 语言 的 能 力 ,， 从 而 支持 了 数据 库 的 概 
念 模型 。 

寻找 更 好 的 数据 库 模 型 的 工作 永 无 止境 ， 其 目标 就 是 希望 找到 的 模型 能 够 容易 地 把 复杂 芯 
数据 库 系统 概念 化 ， 从 而 能 够 以 简明 的 方式 表达 对 信息 的 请 求 ， 以 及 能 够 产生 有 效 的 数据 库 管 
理 系统 。 
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问题 与 练习 

1; 在 一 个 制造 三 中 确定 两 个 部 门 ， 说 明 它们 对 相同 或 者 相似 的 库存 信息 会 有 不 同 的 用 途 。 然 后 ， 说 明 
两 个 部 门 的 子 模式 如 何不 同 。 

2. 数据 库 模 型 的 目标 是 什么 ? 

3. 概述 应 用 软件 和 数据 库 管理 系统 的 作用 。 


9.2 关系 模型 
本 节 将 更 详细 地 讨论 关系 数据 库 模 型 ， 它 描绘 的 是 用 矩形 表格 存放 的 数据 ， 这 种 表格 称 为 


关系 (relation)， 这 类 似 于 电子 制 表 程序 显示 信息 的 格式 。 例 如 ， 在 关系 模型 中 ， 可 以 将 一 个 公 
司 员工 的 信息 表示 为 如 图 9-3 所 示 的 关系 。 





Empl Id Name Address SSN 
EE lh I a Te n pl rr 


| 223333 
999009999 
111005555 





图 9-3 包含 员工 信息 的 一 个 关系 


关系 中 的 一 行 称 为 一 个 元 组 tuple) (有 人 读 作 “TOO-pul”， 也 有 人 读 作 “TUH-pul”)。 在 
图 9-3 所 示 的 关系 中 ,元 组 由 某 个 特定 员工 的 信息 组 成 。 因 为 每 列 描述 的 是 对 应 的 元 组 所 表示 的 
实体 的 一 些 特 征 或 属性 ， 所 以 关系 中 的 列 称 为 属性 (attribute)。 


9.2.1 关系 设计 中 的 问题 


设计 关系 数据 库 的 关键 步骤 是 设计 构成 这 个 数据 库 的 关系 。 尽 管 这 个 工作 看 上 去 很 简单 ， 
但 对 于 粗心 的 设计 者 来 说 ， 仍 有 不 少 难 以 捉摸 的 陷阱 。 

假定 除了 图 9-3 所 示 的 关系 中 所 包含 的 那些 信息 之 外 , 我 们 还 想 要 添加 员工 工作 的 信息 。 
这 里 需要 为 每 个 员工 添加 一 个 工作 经 历 ， 包 括 如 下 一 些 属性 :如 职务 秘书、 办公室 经 理 、 
楼 层 主 管 )、 职 务 代码 (每 种 职务 的 职务 代码 是 唯一 的 )、 与 该 职务 有 关 的 技能 代码 、 该 职务 
所 在 部 门 ， 以 及 该 员工 任职 的 开始 日 期 和 终止 日 期 (如 果 员 工 仍 任 现职 ， 则 终止 日 期 用 * 号 
表示 ) 等 。 

解决 这 个 问题 的 一 种 方法 就 是 扩展 图 9-3 所 示 的 关系 ， 在 表格 中 加 进 图 9-4 所 示 的 这 些 属性 
列 。 然 而 ， 仔 细 检 查 这 个 结果 会 发 现 一 些 问题 。 问 题 之 一 是 ， 信 息 的 宛 余 导致 了 效率 低下 。 这 
个 关系 中 不 再 是 每 个 员工 对 应 一 个 元 组 ， 而 是 每 次 职务 指派 就 对 应 一 个 元 组 。 如 果 一 个 员工 在 
公司 里 历任 好 几 个 职务 ， 那 么 新 关系 中 的 几 个 元 组 就 会 包含 该 员工 的 相同 信息 《姓名 、 地 址 、 
员工 的 工 号 及 社会 保险 号 )。 例 如 ， 因 为 Baker 和 Smith 担 任 过 多 个 职务 ， 所 以 有 关 他 们 的 个 人 信 
息 就 会 有 重复 。 还 有 ， 如 果 某 个 特定 的 职务 由 几 个 员工 担任 过 ， 那 么 与 此 职务 相关 的 部 门 及 相 
应 的 技能 代码 也 会 在 表示 职务 的 每 个 元 组 中 重复 。 例 如 ， 因 为 楼 层 经 理由 多 个 员工 担任 过 ， 所 
以 这 个 职务 的 描述 就 会 重复 。 

对 于 这 样 一 种 扩展 的 关系 ， 如 果 考 虑 从 数据 库 中 删除 信息 的 话 ， 会 导致 另外 一 个 更 为 严重 
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的 问题 。 例 如 ， 假 定 只 有 Joe E. Baker 是 唯一 一 个 拥有 D7 这 个 职务 代码 的 员工 ， 如 果 他 离开 公司 
了 ， 并 从 图 9-4 表 示 的 数据 库 中 删除 ， 那 么 ， 有 关 D7 的 职务 信息 就 会 丢失 ， 因 为 包含 D7 职务 需 
要 K2 技 能 等 级 这 个 事实 的 元 组 ， 只 有 与 Joe E. Baker 有 关 的 那个 元 组 。 


Emplld Name Address SSN ob ld Job TS Skill Save pe Start Date Term Date 














es 9-1-2009 | 9-30-2010 





Neo er 由 Ty 
manager 


111223333 | D7 | Dept. 





33 Nowhere | 111223333 | 
i 





























33 Nowhere 10-1-2010 * 
head 
.| 563 Downtown | 999009999 | F5 | Floor |FN Sales |10-1-2009 
Ave. J manager i 。 | 
1555 Circle 111005555 | S25X | Secretary 4-30-2010 
Dr. 
1555 Circle 111005555 | S26Z | Secretary % 
全 . . 
. . . 二 
. . 本 . 

















图 9-4 包含 元 余 的 关系 


你 也 许 会 认为 ， 能 做 到 只 删除 元 组 中 一 部 分 信息 ， 就 可 以 解决 这 个 问题 ， 但 是 这 又 会 引起 
新 的 麻烦 。 比如, F5 职 务 的 信息 是 留存 在 一 个 部 分 的 元 组 中 , 还 是 留存 在 关系 中 其 他 什么 地 方 ? 
而 且 ， 这 种 利用 部 分 元 组 的 想法 正好 说 明了 该 数据 库 的 设计 还 能 够 进一步 改进 。 





PC 已 经 在 各 种 应 用 〔 从 简单 到 复杂 ) 中 广泛 使 用 。 在 一 些 基本 的 “数据 库 ” 应 用 中 ， 像 
存储 圣诞 贺卡 清单 ， 或 者 维护 保龄球 联赛 记录 等 ， 因为 仅仅 是 要 求 能 对 数据 进行 存储 、 打印 
和 排序 这 样 的 操作 ， 所 以 常常 只 需要 用 电子 表格 系 统 来 代替 数据 库 软 件 就 行 了 。 然而 ，PC 市 
场 上 还 是 有 许多 数据 库 系统 ， 如 微软 公司 的 Access 数 据 库 . 这 是 9.2 节 描述 过 的 一 个 完整 的 关 
系数 据 库 ， 也 是 图 表 和 报告 生成 软件 。 ON ea We eg 
行 产 品 的 支柱 ，Access 向 我 们 做 了 很 好 的 诠释 。 | 


所 有 这 些 问 题 产生 的 原因 就 在 于 我 们 在 一 个 单一 的 关系 里 融 进 了 多 个 概念 。 图 9-4 中 的 扩展 
关系 包含 了 员工 的 直接 信息 〈 姓 名 、 员 工 的 工 号 、 地 址 、 社 会 保险 号 )、 有 关公 司 现 有 职务 的 信 
息 (职务 代号 、 职 务 、 部 门 、 技 能 代码 )， 以 及 有 关 员工 和 职务 间 关 系 的 信息 《开始 日 期 、 终 止 
日 期 )。 基于 以 上 的 分 析 , 我 们 可 以 用 这 样 的 一 种 方式 来 解决 问题 , 即 用 3 个 关系 来 重新 设计 这 
一 系统 ， 每 个 关系 对 应 前 面 的 一 类 信息 。 我 们 可 以 保留 图 9-3 中 所 示 的 那个 原始 关系 现在 我 
们 称 它 为 EMPLOYEE 关 系 ), 再 插入 称 为 JOB 和 ASSIGNMENT 的 两 个 新 关系 , 就 产生 了 图 9-5 所 示 
的 数据 库 。 

这 样 由 这 三 个 关系 组 成 的 数据 库 就 包含 了 : 员工 信息 (在 EMPLOYEE 关 系 中 )、 职务 信息 (在 
JOB 关系 中 )， 以 及 职务 经 历 信 息 〈 在 ASSIGNMENT 关 系 中 )。 其 他 信息 则 隐 含 在 不 同 关系 信息 的 
组 合 中 。 例 如 ， 如 果 知 道 一 个 员工 的 工 号 ， 就 可 以 先 用 ASSIGNMENT 关 系 找 到 该 员工 任职 过 的 
所 有 职务 ， 再 用 JOB 关系 找到 与 这 些 职务 有 关 的 部 门 《 见 图 9-6)， 这 样 就 可 以 找到 这 个 员工 任职 
过 的 部 门 。 通 过 这 样 一 些 步骤， 任何 原先 可 以 从 单一 的 大 型 关系 里 面 获得 的 信息 ， 现 在 都 能 从 3 
个 较 小 的 关系 中 获得 ， 并 且 不 会 出 现 前 面 提 到 的 那些 问题 。 
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EMPLOYEE 关 系 


Empl ld Name Address SSN 





JOB 关系 
Job ld JobTitle Skill Code Dept 





Empl ld Job Id Start Date Term Date 





图 9-5 ”由 三 个 关系 组 成 的 员工 数据 库 
EMPLOYEE 关 系 
Empl ld Name Address SSN 


Joe E. Baker 33 Nowhere St. 111223333 
Cheryl H, Clark 563 Downtown Ave. 999009999 
G. Jerry Smith 1555 Circle Dr. 111005555 

. 





JOB 关 系 
Jobld JobTitle Skill Code Dept 
Secretary Personnel 标志 ， 
Secretary Accounting 吉 在 
Floor manager Sales 部 
和 财务 部 


ASSIGNMENT 关 系 
Start Date 
3-1-1999 4-30-2010 
员工 23Y34 10-1-2009 共 


的 职务 5-1-2010 





图 9-6 ”查找 员工 23Y34 工 作 过 的 部 门 
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但 是 ， 把 信息 划分 到 不 同 的 关系 中 ， 并 不 总 是 像 上 面 提 到 的 例子 那样 顺利 。 例 如 ， 比 较 
图 9-7 中 的 原始 关系 和 建议 分 解 成 两 个 关系 的 EmplId (员工 代号 )、JobTitle (职务 ) 及 Dept 
(部 门 ) 3 个 属性 。 乍 看 起 来 ， 双 关系 系统 与 单 关 系 系统 好 像 包 含 相同 的 信息 ， 但 事实 并 非 如 此 。 
比如 ， 要 查找 某 员 工 工 作 过 的 部 门 ， 这 在 单 关 系 系统 中 很 容易 ， 只 需 查 找 包 含 该 员工 的 工 号 的 
那个 元 组 ， 取 出 相应 的 部 门 即 可 。 然 而 ， 在 双关 系 系统 中 ， 所 要 的 信息 未 必 存 在 。 我 们 可 以 找 
到 该 员工 的 职务 及 具有 这 个 职务 的 一 个 部 门 ， 但 这 并 不 一 定 意味 着 该 员工 就 在 这 个 部 门 工作 ， 
因为 几 个 部 门 可 以 有 同样 的 职务 。 
Empl ld 


包含 员工 、 职 务 及 | 
部 门 的 原始 关系 


JobTitle Dept 








Empl ld oa .9 Dept 


建议 的 分 解 方式 | 





图 9-7 关系 和 提议 的 分 解 


于 是 ， 我 们 可 以 看 出 ， 把 一 个 关系 分 解 成 几 个 比较 小 的 关系 时 ， 信 息 有 时 会 丢失 ， 有 时 不 
会 丢失 ， 后 者 称 为 无 损 分 解 (lossless decomposition， 或 nonloss decomposition)。 对 这 种 关系 特 
性 的 研究 是 重要 的 设计 依据 ， 其 目标 就 是 找 出 会 在 数据 库 设 计 中 引起 问题 的 一 些 关 系 特性 ， 并 
找到 重新 组 织 那 些 关 系 的 方法 来 消除 这 些 出 问题 的 特性 。 


9.2.2 关系 运算 


我 们 对 数据 是 如 何 按 照 关系 模型 来 组 织 的 有 了 基本 的 了 解 以 后 ， 接 下 来 的 工作 就 看 看 如 何 
从 由 关系 组 成 的 数据 库 中 提取 信息 。 我 们 可 以 先 考察 要 对 关系 执行 的 某 些 操作 。 

我 们 常常 要 从 一 个 关系 中 选取 某 些 元 组 。 比 如 ， 要 检索 某 个 员工 的 信息 ， 就 必须 从 
EMPLOYEE 关 系 中 选取 包含 相应 “员工 代号 ”属性 值 的 元 组 ， 或 者 为 了 得 到 某 一 部 门 的 职务 列 
表 ， 就 必须 从 JOB 关系 中 选取 具有 该 部 门 属性 的 元 组 。 这 样 选取 的 结果 是 ， 从 父 关 系 中 选取 的 
元 组 构成 了 另 一 个 关系 。 选 择 某 一 特定 员工 信息 的 结果 是 产生 了 一 个 关系 ， 该 关系 只 包含 从 
EMPLOYEE 关 系 获得 的 一 个 元 组 。 而 选择 与 某 个 部 门 相关 的 元 组 ， 会 生成 一 个 关系 ， 其 中 包含 
来 自 JOB 关 系 的 几 个 元 组 。 

简 而 言 之 ， 在 一 个 关系 上 想 要 执行 的 一 种 运算 就 是 要 选取 具有 某 些 特性 的 元 组 ， 并 把 这 些 
选 出 的 元 组 放 到 一 个 新 的 关系 中 。 为 了 表示 这 种 运算 ， 我 们 采用 下 面 的 语法 : 


NEW 二 SELECT from EMPLOYEE where EmplIQ = '34Y70' 


此 语句 的 语义 是 : 创建 一 个 名 为 NEW 的 新 关系 ， 它 包含 从 EMPLOYEE 关 系 选 得 的 其 EmplId 属 性 
等 于 34Y70 的 那些 元 组 (本 例 中 应 该 只 有 一 个 元 组 )( 见 图 9-8)。 

SELECT 运 算是 从 一 个 关系 中 提取 行 ， 与 此 相反 ，PROJECT 运 算 则 是 提取 列 。 例 如 ， 假 定 在 
查找 某 部 门 的 职务 时 ， 已 经 从 JOB 关系 中 SELECT (选取 ) 得 到 与 该 部 门 对 应 的 元 组 ， 并 把 这 些 
关系 放 到 一 个 叫 NEW1 的 新 关系 中 。 我 们 要 查找 的 列表 是 这 个 新 关系 里 的 JobTitle 列 。PROJECT 
运算 就 是 提取 这 个 列 ( 或 者 必要 时 是 儿 个 列 )， 并 把 结果 放 到 一 个 新 关系 中 。 这 个 运算 表示 为 
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NEW2 « PROJECT JobTitle from NEW1 
其 结果 是 创建 男 一 个 新 关系 (名 为 NEW2)， 它 包含 从 NEW1 关 系 中 JobTitle 列 得 到 的 那些 值 所 
构成 的 一 个 列 。 








Emplld Name Address SSN 
25X15 Joe E. Baker 33 Nowhere St. 111223333 
‘34Y70 | Cheryl H. Clark 563 Downtown Ave. 999009999 
EMPLOYEE 关系 23Y34 | G. Jerry Smith 1555 Circle Dr 111005555 
. . . . 






Wh Emplld = ay 


Name Address SSN 
a Cheryl H. Clark | 563 Downtown Ave. 999009999 

















图 9-8 SELECT 运算 


作为 PROJECT 运 算 的 男 一 个 例子 ， 语 句 

MAIL ~ PROJECT Name, Address from EMPLOYEE 
可 以 用 来 获取 所 有 员工 的 姓名 和 地 址 的 列表 。 这 个 列表 是 新 创建 的 (两 列 ) 关系 , 名 为 MAIL ( 见 
图 9-9)。 





Empl ld “Name Address SSN 
Joe E. Baker 33 Nowhere St. 111223333 
Cheryl H. Clark 563 Downtown Ave. 999009999 
EMPLOYEE 关系 G. dany Smith 1555 Girole Dr 人 ep 
. . . 
. . . 





| 


MAIL PROJECT Name’, Address from EMPLOYEE 


Name Address 
Joe E. Baker 33 Nowhere St. 
Cheryl H. Clark 563 Downtown Ave. 
MAIL 关系 G. Jerry Smith 1555 Circle Dr. 
. 





图 9-9 ”PROJECT 运 算 


另外 的 一 个 用 于 连接 关系 数据 库 的 运算 是 JOIN 运 算 , 它 用 来 把 原来 不 同 的 关系 组 合成 一 个 
关系 。 两 个 关系 JOIN (连接 ) 产生 一 个 新 关系 ， 而 新 关系 的 属性 则 由 原来 两 个 关系 的 属性 组 成 
( 见 图 9-10)。 这 些 属性 的 名 称 与 原先 关系 中 的 名 称 一 样 ， 只 是 每 个 都 加 上 了 原 关系 作为 前 级 。( 如 
果 包 含 属 性 V 和 Ww 的 关系 A 与 包含 属性 Xx、Y 及 z 的 关系 B 相 JOIN， 那 么 结果 就 有 名 为 A.V、A.W、 
B.X、B.Y 和 B.z 的 5 个 属性 。) 这 种 命名 约定 保证 了 新 关系 的 属性 只 有 唯一 的 名 称 ， 即 使 原先 的 
儿 个 关系 中 有 相同 的 属性 名 称 也 没关系 。 


9.2 ”关系 模型 299 


+" © © DIN 


p 


C<-JOINAand Bwhere AW=B.X 


AV AW BX BY B.Z 





图 9-10 JOIN 运算 

新 关系 的 元 组 〈 行 ) 由 原来 两 个 原始 关系 的 元 组 拼接 而 成 《再 见 图 9-10)。 哪 几 个 元 组 会 连 
接 成 新 关系 的 元 组 取决 于 JOIN (连接 ) 的 条 件 。 一 个 条 件 就 是 指定 的 属性 要 有 相同 值 。 事 实 上 ， 
图 9-10 表 示 的 就 是 这 种 情况 ， 它 演示 了 执行 语句 

C - JOIN A and B where A.W = B.X 
的 结果 。 在 这 个 例子 里 ， 关 系 A 的 一 个 元 组 与 关系 B 的 一 个 元 组 拼接 ， 其 条 件 正 是 两 个 元 组 的 属性 W 
和 Xx 值 相等 。 因 此 ， 关 系 A 的 元 组 (r, 2) 与 关系 B 的 元 组 (2, m, q) 的 拼接 出 现在 结果 中 ， 因 为 第 一 
个 元 组 中 的 wm 属性 的 值 等 于 第 二 个 元 组 中 Xx 属性 的 值 。 男 一 方面 ， 在 最 后 的 关系 中 并 没有 关系 A 的 元 
组 (r,2) 与 关系 B 的 元 组 (5, g, p) 拼接 的 结果 ， 这 是 因为 这 些 元 组 在 属性 w 和 X 中 没有 共享 共同 的 值 。 

再 看 一 个 例子 ， 图 9-11 所 示 为 执行 下 列 语句 的 结果 : 


C -JOIN A and B where A.W < B.X 


注意 ， 结 果 中 的 元 组 正 是 其 中 关系 A 中 的 属性 w 小 于 关系 B 中 的 属性 x 的 那些 元 组 。 


W 
六 

关系 A t 4 关系 B 
p 6 


C<-JOINA and Bwhere AW <B.X 


AV AW BX BY BZ 


r 2 4 
关系 C r 2 
t 4 


图 9-11 JOIN 运算 的 另外 一 个 例子 


mm 上 一 | 溉 
+ 3 a 
De IN 











5 
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现在 来 看 怎样 对 图 9-5 中 的 数据 库 用 JOIN 运算 来 获取 一 个 列表 ， 其 中 包括 所 有 员工 的 员工 
工 号 及 每 个 员工 的 工作 部 门 。 首 先 看 到 ， 所 要 的 信息 分 散在 一 个 以 上 的 关系 中 ， 所 以 检索 信息 
单 靠 SELECT 和 PROJECT 是 不 行 的 。 实 际 上 ， 我 们 所 需要 的 工具 是 语句 
NEW1 «~ JOIN ASSIGNMENT and JOB 
where ASSIGNMENT .JobId = JOB.JobId 


如 图 9-12 所 示 ， 它 产生 了 一 个 关系 NEW1。 通 过 这 个 关系 ,我 们 的 问题 就 能 得 到 解决 ， 即 先 SELECT 
其 中 ASSIGNMENT.TermDate 等 于 '*' ('*' 表 示 “ 还 在 任职 期 *?) 的 那些 元 组 ， 然 后 在 
RSSIGNMENT.EmplId 和 JOB.Dept 属 性 上 进行 PROJECT 运 算 。 简 而 言 之 ， 我 们 需要 的 信息 可 以 
从 图 9-5 中 所 示 的 数据 库 通 过 执行 以 下 语句 来 获得 : 

NEW1 ~ JOIN ASSIGNMENT and JOB 

where RSSIGNMENT .JobIQ = JOB.JobId 
NEW2 一 SELECT from NEW]1 where RSSIGNMENT .TermDate = "'*'! 
LIST .~ PROJECT RSSIGNMENT .Empl1Idq, JOB.Dept from NEW2 


ASSIGNMENT 关系 JOB 关系 
Empl Id Job ld Start Date Term Date Jobld JobTitle Skill Code Dept 


























3-1-1999 
10-1-2009 
5-1-2010 


4-30-2010 Personnel 


Accounting 


Secretary 
Secretary 
Floor manager 






JOB where ASSIGNMENT.Jobld = JOB.Jobld 


| 


NEW1 关 系 
ASSIGNMENT ASSIGNMENT ASSIGNMENT ASSIGNMENT JOB JOB JOB JOB 
Empl ld Job Id StartDate TermDate Job ld JobTitle SkillCode Dept 


3-1-1999 4-30-2010 S25X Secretary Personnel 
Floor manager Sales 
Secretary Accounting 
. 





图 9-12 ”JOIN 运算 的 应 用 


9.2.3 SQL 


介绍 了 基本 的 关系 运算 之 后 ， 接 下 来 要 考虑 的 是 数据 库 系 统 的 总 体 结构 。 我 们 知道 ， 数 据 
库 实际 上 是 存放 在 海量 存储 系统 中 的 。 为 了 让 应 用 程序 员 免 于 关注 这 种 系统 的 细节 ， 人 们 设计 
了 数据 库 管 理 系统 ， 使 应 用 软件 能 够 按照 数据 库 模型 《如 关系 模型 ) 来 编写 。 数 据 库 管理 系统 
接受 模型 方式 的 命令 ， 并 把 这 些 命令 转换 为 与 实际 存储 结构 有 关 的 操作 。 这 种 转换 由 数据 库 管 
理 系统 提供 的 一 组 例 程 来 实现 ， 应 用 软件 将 它们 用 作 抽 象 工 具 。 因 此 ， 基 于 关系 模型 的 数据 库 
管理 系统 会 包括 能 够 完成 SELECT、PROJECT 和 JOIN 运 算 的 例 程 ， 应 用 软件 可 以 调用 它们 。 通 
过 这 样 的 方式 ， 编 写 应 用 软件 就 好 像 数 据 库 真 的 是 存放 在 关系 模型 的 简单 表格 中 的 。 

今天 的 关系 数据 库 管 理 系统 不 一 定 提供 执行 原始 形式 的 SELECT、PROJECT 及 JOIN 运 算 的 例 
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程 ， 而 是 提供 一 些 组 合 了 这 些 基 本 步骤 的 例 程 。 其 中 的 一 个 例子 就 是 结构 化 查询 语言 (Structured 
Query Language，SQL)， 它 构成 了 绝 大 多 数 关 系数 据 库 查询 系统 的 主干 。 例 如 ，SQL 是 因特网 
上 许多 数据 库 服 务 器 采用 的 关系 数据 库 系统 MySQL 〈 读 作 “My-S-Q-L”) 的 基础 语言 。 

SQL 流行 的 一 个 原因 是 美国 国家 标准 学 会 已 经 将 它 标准 化 了 ， 另 一 个 原因 是 它 起 初 是 由 
IBM 公 司 开 发 和 发 布 的 ， 因 而 备 受 媒体 关注 ， 所 以 流行 起 来 了 。 本 节 将 解释 如 何 用 SQL 表达 关 
系数 据 库 的 查询 。 

虽然 看 起 来 用 SQL 表述 的 查询 好 像 是 以 命令 的 形式 来 完成 的 ， 但 本 质 上 它 是 一 种 陈述 性 的 语句 。 
应 当 把 一 条 SQL 语句 看 作 是 对 所 需 信息 的 一 种 描述 ， 而 不 是 一 串 要 执行 的 操作 。 这 样 的 意义 在 于 ， 有 
了 SQL， 应 用 程序 员 不 必 为 开发 处 理 关系 的 算法 而 花费 精力 ， 他 们 只 要 描述 所 需 的 信息 就 可 以 了 。 

作为 SQL 语句 的 第 一 个 例子 ， 我 们 现在 来 考虑 上 面 提 到 的 那个 查询 例子 。 在 那个 例子 中 ， 
为 了 获取 所 有 员工 的 工 号 及 其 所 在 部 门 而 开发 设计 了 一 个 3 步 的 处 理 过 程 。 在 SQL 中 ， 整 个 查询 
用 下 面 这 样 一 条 语句 就 可 以 表示 : 

SELECT EmplId, Dept 

FROM Assignment, Job 


WHERE Assignment,.,JobId = Job.JobId 
RND Assignment.TermDate = '*',， 


从 此 例 可 以 看 到 ， 每 条 SQL 查 询 语句 可 包含 3 条 子 句 ; 一 条 select 子 名 、 一 条 from 子 句 和 一 条 
where 子 句 。 粗 略 地 说 ， 其 实 这 样 一 条 语句 就 是 请 求 如 下 几 个 操作 的 结果 : from 子 句 中 列 出 的 
所 有 关系 的 JOIN 操作 ; 然后 是 SELECT 操作 ， 即 选择 出 满足 where 子 句 中 条 件 的 那些 元 组 ; 最 后 
是 PROJECT 操 作 ， 即 在 select 子 句 中 列 出 的 那些 元 组 上 进行 PROJECT 运 算 。 (注意 ， 因 为 SQL 
语句 中 的 select 子 句 确定 的 是 PROJECT 运 算 中 所 用 的 属性 ， 所 以 ， 术 语 有 一 些 颠 倒 )。 让 我 们 
来 看 一 些 简单 的 例子 。 

下 面 的 语句 产生 了 一 个 包含 在 Employee 关 系 中 的 所 有 员工 姓名 以 及 地 址 的 列表 : 

SELECT Name, Address 

FROM Employee; 
注意 ， 这 仅仅 是 一 个 PROJECT 运 算 。 

下 面 的 语句 产生 了 Employee 关 系 中 与 Cheryl H. Clark 相 关 的 元 组 的 所 有 信息 : 

SELECT Emplld, Name, Address, SSNum 

FROM Employee 

WHERE Name = 'Cheryl H. Clark'; 
这 其 实 是 一 个 SELECT 运算 。 

下 面 的 语句 产生 了 Employee 关 系 中 Cheryl H. Clark 的 姓名 和 地 址 信息 。 这 是 一 个 SELECT 和 
PROUECT 的 组 合 运算 : 


SELECT Name, Address 
FROM Employee 
WHERE Name = 'Cheryl H. Clark'; 


下 面 的 语句 产生 一 个 所 有 员工 姓名 及 其 开始 工作 日 期 的 列表 : 


SELECT Employee.Name, Assignment.StartDate 
FROM Employee, Assignment 
WHERE Employee.EmpllId = Assignment.EmplId; 


注意 , 这 是 如 下 几 个 操作 的 结果 : 首先 对 Employee 和 Assignment 两 个 关系 进行 JOIN 操 作 ， 然 
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后 对 在 where 子 句 及 select 子 句 中 指定 的 元 组 和 属性 进行 SELECT 操 作 和 PROJECT 操 作 。 
最 后 ， 我 们 需要 指出 的 是 ，SQL 语 句 除了 可 以 执行 查询 ， 还 可 以 定义 关系 的 结构 ， 创 建 关 
系 ， 以 及 修改 关系 的 内 容 。 例 如 ， 下 面 是 一 些 INSERT INTO、DELETE FROM 和 UPDATE 语 句 的 
例子 。 
下 面 的 语句 表示 在 Employee 关 系 中 增加 给 定 值 的 元 组 : 
INSERT INTO Employee 
VALUES.( 42212", 'Sue A, Burt', 133 Fair St 7 '444661111"); 
下 面 的 语句 表示 从 Employee 关 系 中 删除 与 G. Jerry Smith 有 关 的 元 组 : 
DELETE FROM Employee 
WHERE Name = 'G, Jerry Smith'; 
而 下 面 的 语句 表示 修改 Employee 关 系 中 与 Joe E Baker 有 关 的 元 组 中 的 地 址 信息 : 


UPDATE Employee 


SET Address = '1812 Napoleon Ave.' 
WHERE Name = 'Uoe E. Baker'; 
问题 与 练习 


1. 根据 图 9-5 中 所 示 的 EMPLOYEE 关 系 、JOB 关 系 和 ASSIGNMENT 关 系 提供 的 部 分 信息 ， 回 答 下 列 问 题 : 
a. 指出 谁 既是 财务 部 秘书 ， 又 具有 在 人 事 部 工作 的 经 历 ? 
b. 指出 谁 是 销售 部 的 楼 层 经 理 ? 
“c.，G. Jerry Smith 现 在 的 工作 职务 是 什么 ? 
根据 图 9-5 所 示 的 EMPLOYEE 关 系 、 CR 写 出 要 获取 一 份 人 事 部 的 所 有 职务 
列表 所 需 的 关系 操作 。 
. 根据 图 9-5 所 示 的 EMPLOYEE 关 系 、JOB 关 系 和 ASSIGNMENT 关 系 ， 写 出 要 获取 一 份 员 工 姓 名 及 其 工作 
部 门 列表 所 需 的 关系 操作 。 
. 把 你 的 第 2 题 和 第 3 题 的 答案 转换 成 SQL 语 句 。 
. 说 明 关系 模型 是 如 何 提供 数据 独立 性 的 ? 
. 说 明 在 一 个 关系 数据 库 中 ， 不 同 的 关系 是 怎样 联系 在 一 起 的 ? 
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*9.3 面向 对 象 数据 库 


另 一 种 数据 库 模 型 是 基于 面向 对 象 范 型 的 。 运 用 面向 对 象 方法 构建 的 数据 库 称 为 面向 对 象 
数据 库 (object-oriented database)， 它 由 对 象 构成 ， 对 象 之 间 通 过 相互 链接 来 反映 它们 之 间 的 关 
系 。 例 如 ， 员 工 数据 库 的 面向 对 象 实现 可 以 包含 3 个 类 (对 象 的 类 型 ):， Employee、Job 和 
Assignment。Employee 类 的 对 象 可 以 包含 EmplId、Name、Address 及 SSNum 这 些 属性 ; Job 
类 的 对 象 可 以 包含 JobId、JobTitle、SkillCode 及 Dept 这 些 属性 ; Assignment 类 的 对 象 可 
以 包含 StartDate 及 TermDate 这 些 属性 。 

面向 对 象 数据 库 的 概念 表示 如 图 9-13 所 示 ， 其 中 两 个 不 同 对 象 间 的 链接 可 以 用 连接 两 个 相 
关 对 象 的 线 来 表示 。 如 果 我 们 注意 Employee 类 型 的 对 象 ， 会 发 现 ， 它 链接 到 了 Assignment 类 
型 的 一 组 对 象 ， 表示 某 个 员工 任职 过 的 不 同 职务 。 同 样 ，Assignment 类 型 的 每 个 对 象 也 都 链接 
到 了 Job 类 型 的 一 个 对 象 ， 表 示 某 个 职务 与 某 个 指派 相关 。 所 以 ， 只 要 沿 着 表示 某 员 工 的 对 象 
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的 链接 进行 查找 ， 就 能 找到 该 员工 所 有 的 任职 情况 。 类 似 地 ， 可 以 通过 表示 某 工 作 的 对 象 的 链 
接 ， 找 到 从 事 过 该 工作 的 所 有 员工 。 





图 9-13 ”面向 对 象 数据 库 中 两 个 对 象 之 间 的 关联 


通常 ， 面 向 对 和 象 数 据 库 中 两 个 对 象 之 间 的 链接 是 由 数据 库 管理 系统 来 维护 的 ， 所 以 有 关 这 
些 链 接 是 如 何 实现 的 细节 ， 无 需 编写 应 用 软件 的 程序 员 关 心 。 相 反 ， 当 向 数据 库 中 增加 新 对 象 
时 ， 应 用 软件 只 要 指明 这 个 新 对 象 应 当 与 哪些 对 象 相 链 接 就 可 以 了 。 然 后 由 数据 库 管 理 系 统 创 
建 为 记录 这 些 关 联 信 息 所 需 的 链接 系统 。 具 体 地 说 ， 数 据 库 管理 系统 会 以 类 似 于 链表 的 形式 ， 
把 表示 某 员工 的 职务 的 对 象 链接 起 来 。 

面向 对 象 的 数据 库 管 理 系统 的 另 一 个 任务 就 是 要 为 其 托管 的 对 象 提供 永久 的 存储 空间 ， 
这 个 要 求 看 起 来 显而易见 ， 但 它 与 处 理 对 象 的 常规 方式 有 着 本 质 的 不 同 。 通 常 ， 在 执行 一 个 
面向 对 象 的 程序 时 ， 程 序 执 行 期 间 创 建 的 对 象 在 程序 终止 时 就 会 被 丢弃 。 从 这 个 意义 上 看 ， 
可 以 认为 对 象 是 临时 的 。 但 是 ,在 数据 库 中 创建 或 添加 的 对 象 ,在 创建 它们 的 程序 终止 后 必 
须 保 存 。 这 样 的 对 象 称 为 持久 (persistent) 对象。 所以， 创建 持 久 对 象 与 创建 常规 对 象 有 很 
大 不 同 。 

面向 对 象 数据 库 的 支持 者 提出 许多 论据 ， 来 说 明 为 什么 用 面向 对 和 象 方法 设计 的 数据 库 要 比 
用 关系 方法 设计 的 好 。 其 中 一 个 论据 是 说 ， 面 向 对 象 方法 使 整个 软件 系统 〈 应 用 软件 、 数 据 库 
管理 系统 和 数据 库 本 身 ) 用 同样 的 范 型 来 设计 。 这 与 以 往 开发 询问 关系 数据 库 的 应 用 软件 通常 
是 采用 命令 型 程序 设计 语言 不 同 。 在 这 样 的 任务 中 ， 命 令 范 型 与 关系 范 型 之 间 的 冲突 是 不 可 避 
免 的 。 就 我 们 学 习 的 水 平 而 言 ， 这 种 差别 是 很 小 的 ， 但 是 多 年 以 来 ， 这 种 差别 正 是 许多 软件 错 
误 的 根源 。 即 使 以 现 有 的 知识 水 平 ， 我 们 也 能 够 理解 ， 面 各 对 象 数据 库 与 面向 对 象 应 用 程序 的 
结合 产生 了 一 种 整个 系统 中 的 对 象 相互 间 进 行 通信 的 景象 。 另 一 方面 ， 关 系数 据 库 与 命令 型 应 
用 程序 的 结合 ， 给 人 的 感觉 是 产生 了 两 种 本 质 上 不 同 的 组 织 企 图 寻找 共同 接口 的 景象 。 

为 了 理解 面向 对 象 数据 库 相 对 于 关系 数据 库 的 另 一 个 优势 ， 这 里 我 们 先 来 看 一 个 在 关系 数 
据 库 中 存储 员工 姓名 的 问题 。 如 果 把 全 名 存储 在 一 个 关系 的 单个 属性 中 ， 那 么 查询 姓氏 就 会 
比较 麻烦 。 然 而 ， 如 果 将 全 名 分 存 于 3 个 分 开 的 属性 中 ， 如 名 字 、 中 间 名 和 姓 ， 那 么 ， 在 处 理 
不 遵循 这 种 姓名 模式 的 人 员 时 ， 也 会 遇 到 难题 一 一 即使 仅 处 理 单 一 文化 中 的 人 名 也 是 如 此 。 
在 面向 对 象 数据 库 中 ， 这 些 问题 就 可 以 隐藏 在 存储 员工 姓名 的 对 象 里 。 一 个 员工 的 姓名 可 以 
存储 为 一 个 智能 对 象 ， 它 能 以 不 同 的 格式 输出 有 关 员 工 的 姓名 。 所 以 ， 从 这 些 对 象 外 部 看 ， 
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对 于 处 理 姓 氏 、 全 名 、 结 婚前 的 姓氏 或 者 绰号 等 ， 都 是 一 样 地 简单 。 每 种 视角 所 涉及 的 细节 
都 会 被 封装 于 对 象 中 。 

能 把 不 同 的 数据 格式 的 术语 进行 封装 也 是 一 个 优点 。 在 关系 数据 库 中 ， 关 系 中 的 属性 是 数 
据 库 从 头 至 尾 需要 设计 的 一 部 分 , 所 以 与 这 些 属性 有 关 的 数据 类 型 将 遍及 整个 数据 库 管 理 系统 。 
(临时 存储 的 变量 必须 声明 为 适当 的 类 型 ,并且 必须 要 设计 出 处 理 不 同类 型 数据 的 函数 。) 因此 ， 
要 扩展 一 个 包含 新 类 型 (音频 和 视频 ) 属性 的 关系 数据 库 ， 就 很 可 能 会 遇 到 问题 。 具 体 来 说 ， 
贯穿 数据 库 设计 的 各 种 函数 都 必须 进行 扩展 ， 才 能 包含 这 些 新 的 数据 类 型 。 然 而 ， 在 面向 对 象 
设计 中 ， 用 来 取得 表示 员工 姓名 的 对 象 的 函数 ， 同 样 也 可 用 来 取得 表示 一 段 运动 图 像 的 对 象 ， 
因为 类 型 的 差异 被 隐藏 在 了 所 涉及 的 对 象 里 。 因 此 ， 面 向 对 象 方法 显得 与 多 媒体 数据 库 的 构建 
更 协调 ， 而 这 个 特性 已 经 被 证 明 具 有 极 大 的 优势 。 

面向 对 象 范 型 对 数据 库 设计 而 言 ， 还 有 一 个 好 处 ， 就 是 它 有 存储 智能 对 象 而 不 仅仅 只 是 数 
据 的 潜力 。 也 就 是 说 ， 对 象 能 够 包含 一 些 方法 ， 用 来 描述 它 应 如 何 响应 有 关 它 的 内 容 和 关系 的 
消息 。 例 如， 图 9-13 中 所 示 的 Employee 类 的 每 个 对 象 都 能 够 包含 用 于 报告 和 更 新 这 个 对 象 信息 
的 方法 ， 也 有 显示 员工 工作 经 历 的 方法 ， 甚 至 还 可 能 有 用 于 更 改 员工 职务 的 方法 。 同 样 ，Job 
类 的 每 个 对 象 都 可 以 有 用 于 报告 职务 属性 的 方法 ， 还 可 以 有 用 于 报告 任 过 此 职 的 那些 员工 的 方 
法 。 这 样 一 来 ， 要 检索 员工 的 工作 经 历 ， 就 不 需要 再 编写 复杂 的 函数 了 ， 只 需要 询问 相应 的 员 
工 对 象 就 能 报告 其 工作 经 历 。 如 果 构 建 的 数据 库 有 这 样 的 能 力 ， 即 它 的 组 成 部 分 能 够 智能 地 回 
应 查询 请 求 ， 那 么 它 就 能 提供 一 些 比较 传统 的 关系 数据 库 所 无 法 提供 的 、 令 人 兴奋 的 功能 。 


问题 与 练习 


1 本 节 讨 论 的 员工 数据 库 中 ，assignment 类 的 对 象 的 实例 应 包公 此 方法? 

2. 什么 是 持久 对 象 ? 

3 试 靖 定 在 一 个 处 理 仓库 库存 的 面向 对 象 数据 库 中 要 用 到 哪些 类 以 及 这 些 类 的 哪些 内 部 特征 。 
4. 试 说 明 相对 关系 数据 库 而 言 ， 面向 对 象 数据 库 的 优越 性 。 





*9.4 ”维护 数据 库 的 完整 性 


个 人 使 用 的 廉价 数据 库 管理 系统 是 相对 比较 简单 的 系统 。 它 们 大 致 有 一 个 单纯 的 目标 ， 即 
向 用 户 隐 藏 数据 库 实现 的 技术 细节 。 用 这 类 系统 维护 的 数据 库 相 对 比较 小 ， 所 包含 的 信息 也 不 
会 非常 重要 ， 信 息 的 丢失 或 破坏 通常 只 会 带 来 不 便 ， 而 不 至 于 造成 灾难 性 的 后 果 。 当 问题 真 的 
发 生 时 ， 用 户 通常 可 以 直接 改正 错误 项 ， 或 者 用 备份 重新 加 载 数 据 库 ， 并 手工 做 些 必要 的 修改 ， 
使 数据 库 能 够 及 时 更 新 。 这 样 的 处 理 过 程 也 许 不 太 方便 ， 但 是 ， 为 避免 这 种 麻烦 所 花 的 代价 要 
比 麻烦 本 身 还 大 。 无 论 怎 么 说 ， 这 种 麻烦 只 局 限于 少数 人 身上 ， 并 且 经 济 损失 通常 也 有 限 。 

然而 ， 就 大 型 的 多 用 户 商用 数据 库 系 统 来 说 ， 利 害 关 系 就 大 得 多 。 数 据 出 错 或 丢失 的 代 
价 会 十 分 巨大 ， 甚 至 会 带 来 毁灭 性 的 后 果 。 在 这 样 的 环境 下 ， 数 据 库 管 理 系统 的 主要 作用 就 
是 维护 数据 库 的 完整 性 ， 防 止 问题 的 发 生 ， 如 因 某 种 原因 只 完成 了 部 分 操作 ， 或 因 朴 忽 导 致 
不 同 操作 之 间 相 互 作 用 ， 从 而 造成 数据 库 信息 出 错 等 问题 。 本 节 就 来 阐述 数据 库 管 理 系统 的 
这 种 作用 。 


9.4.1 提交 / 回 滚 协 议 
单个 事务 ， 如 从 一 个 银行 账户 到 另 一 银行 账户 的 转账 、 预 订 航班 的 取消 、 学 生 大 学 课程 的 
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登记 ， 可 能 在 数据 库 层 次 需要 多 个 步骤 。 例 如， 两 个 银行 账户 之 间 的 资金 转账 要 求 一 个 账户 的 
余额 减少 ， 同 时 另 一 个 账户 的 余额 增加 。 在 这 些 步骤 之 间 ， 数 据 库 中 的 信息 可 能 会 不 一 致 。 事 
实 上 ， 在 第 一 个 账户 余额 已 减少 ， 而 另 一 个 账户 余额 尚未 增加 的 这 一 短暂 时 间 里 ， 资 金 有 可 能 
会 不 见 。 类 似 地 ， 当 为 一 个 乘客 重新 安排 航班 座位 时 ， 会 有 一 瞬间 这 个 乘客 没有 座位 ， 或 者 有 
一 瞬间 乘客 名 单 中 的 乘客 数 会 比 实际 乘客 数 多 出 一 位 。 

对 于 大 型 数据 库 而 言 ， 事 务 量 会 很 繁重 ， 在 任意 一 个 瞬间 ， 数 据 库 极 有 可 能 处 于 某 个 事务 
的 中 间 状 态 。 一 个 执行 事务 的 请 求 或 者 一 个 设备 的 故障 ， 很 可 能 会 发 生 在 数据 库 处 于 不 一 致 状 
态 的 这 个 时 候 。 

首先 我 们 来 考虑 故障 问题 。 数 据 库 管理 系统 的 目标 就 是 要 保证 这 种 问题 不 会 把 数据 库 冻 结 
在 不 一 致 的 状态 。 为 了 做 到 这 一 点 ， 需 要 维护 一 个 用 来 记录 每 个 事务 活动 的 日 志文 件 ， 该 日 志 
文件 通常 存储 在 磁盘 等 非 易 失 性 的 存储 系统 中 。 人 允许 事务 更 改 数据 库 之 前 ， 先 将 要 执行 的 更 改 
记录 到 日 志文 件 中 。 这 样 ， 这 个 日 志文 件 就 包含 了 每 个 事务 操作 的 持久 性 记录 。 

把 一 个 事务 的 所 有 步骤 记录 进 日 志文 件 的 那个 点 ， 称 为 提交 点 〈commit point)。 正 是 在 这 
个 点 上 上， 数据库 管理 系统 拥有 在 必要 时 靠 自己 重建 事务 所 需要 的 信息 。 同 时 ， 在 这 个 点 上 ， 数 
据 库 管理 系统 在 一 定 意 义 上 为 事务 提供 了 保证 ， 即 它 负 责 确 保 事务 活动 在 数据 库 中 得 到 反映 。 
在 出 现 设备 故障 的 情况 下 ， 数 据 库 管 理 系统 可 以 利用 其 日 志文 件 中 的 信息 ， 重 建 自 上 一 次 备份 
以 来 已 经 完成 的 (提交 的 ) 事务 。 

如 果 问 题 出 现在 事务 达到 其 提交 点 之 前 ， 那 么 数据 库 管理 系统 可 能 会 发 现 自己 不 能 完成 已 
经 执行 了 一 部 分 的 事务 。 这 种 情况 可 以 利用 日 志 回 滚 (roll back) 〈 也 称 为 撤销 ) 实际 上 已 被 事 
务 执行 的 活动 。 例 如 ， 在 出 现 故障 的 情况 下 ， 数 据 库 管理 系统 可 以 通过 撤销 那些 在 故障 发 生 时 
没有 完成 《或 称 为 未 提交 ) 的 事务 ， 得 到 恢复 。 

然而 ， 事 务 的 回 滚 并 不 局 限于 设备 故障 恢复 的 处 理 。 它 们 常常 也 是 数据 库 管理 系统 正常 操 
作 的 一 部 分 。 例 如 ， 由 于 有 试图 访问 特权 信息 的 情况 发 生 ， 事 务 可 能 会 在 完成 全 部 步骤 前 被 终 
止 ; 或 者 可 能 是 遇 到 死 锁 情况 ， 即 竞争 资源 的 几 个 事务 发 觉 自 己 一 直 在 等 竺 数据， 而 等 待 的 数 
据 正 好 被 对 方 使 用 。 在 这 些 情况 下 ， 数 据 库 管理 系统 能 够 利用 日 志 回 滚 事务 ， 从 而 避免 未 完成 
的 事务 使 数据 库 出 错 。 

为 强调 数据 库 管 理 系统 设计 的 精妙 特性 ,我 们 要 指出 ， 回 滚 过 程 中 隐藏 着 许多 微妙 的 问题 。 
一 个 事务 的 回 滚 可 能 会 影响 到 其 他 的 事务 已 用 过 的 数据 库 项 。 例 如 ， 正 被 回 滚 的 事务 可 能 已 经 
更 新 了 一 个 账户 余额 ， 而 另 一 个 事务 已 进行 的 活动 可 能 就 是 基于 这 个 更 新 的 值 。 这 就 意味 着 这 
些 另 外 的 事务 也 得 回 深 ， 从 而 又 会 影响 到 别 的 事务 ， 结 果 就 产生 了 称 为 级 联 回 深 (cascading 
rollback) 的 问题 。 


9.4.2 ”锁定 


现在 我 们 来 考虑 这 样 一 个 问题 ， 即 执行 某 个 事务 时 ， 正 值 数据 库 因 男 一 事务 而 处 于 变迁 状 
态 ， 这 种 情况 下 会 无 意 中 造 成 两 个 事务 间 的 相互 影响 ， 从 而 会 产生 错误 的 结果 。 例 如 ， 如 果 一 
个 事务 正 从 一 个 账户 转账 到 另 一 个 账户 ， 而 另 一 个 事务 试图 计算 银行 存款 总 额 ， 就 会 产生 错误 
决算 问题 (incorrect summary problem)。 依 据 转 账 步骤 的 先后 次 序 ， 结 果 就 可 能 会 造成 存款 总 数 
不 是 太 大 ， 就 是 太 小 。 另 一 个 可 能 出 现 的 问题 是 更 新 丢失 问题 (lost update problem)。 例 如 ， 有 
两 个 事务 , 每 个 事务 都 是 完成 从 同一 账户 扣除 金额 的 操作 。 如 果 一 个 事务 读 取 账户 的 当前 余额 时 ， 
正 值 另 一 个 事务 刚 读 取 过 余额 但 尚未 计算 好 新 余额 的 时 候 ， 那 么 这 两 个 事务 都 会 在 同一 个 初始 余 
额 上 进行 扣除 操作 ， 这 样 一 来 ， 其 中 一 个 扣除 的 影响 将 不 会 反映 在 数据 库 中 。 

为 了 解决 这 样 的 问题 ， 数 据 库 管理 系统 可 以 强制 以 一 次 执行 一 个 整体 事务 的 方式 来 处 理事 
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务 ， 即 每 个 新 的 事务 要 进行 排队 等 待 ， 直 到 它 前 面 的 事务 全 部 完成 后 才能 得 到 执行 。 但 是 事务 
常常 要 花费 很 多 时 间 来 等 待 海量 存储 操作 的 完成 。 这 里 可 以 采用 这 样 一 种 方式 来 解决 这 个 问题 ， 
即 通过 事务 之 间 的 交叉 执行 ， 可 以 实现 把 一 个 事务 等 待 的 时 间 分 配给 另 一 个 事务 ， 用 来 处 理 它 
已 经 获得 的 数据 。 大 多 数 大 型 数据 库 管 理 系统 都 有 一 个 调度 程序 来 协调 事务 间 的 分 时 ， 这 非常 
像 多 道 程序 操作 系统 里 协调 进程 的 交叉 处 理 〈 见 3.3 节 )。 

为 了 防止 错误 决算 问题 和 更 新 丢失 问题 这 一 类 异常 情况 的 出 现 ， 这 些 调度 程序 都 包含 
个 锁定 协议 (locking protocol)， 该 协议 规定 ， 数 据 库 中 当前 正在 被 某 个 事务 使 用 的 项 目 都 要 加 
以 标记 。 这 些 标记 称 为 锁 , 已 标记 的 项 目 称 为 被 锁定 。 有 两 种 类 型 的 锁 比 较 常 见 , 即 共享 锁 (shared 
lock) 和 排 它 锁 (exclusive lock)， 它 们 分 别 对 应 于 访问 事务 所 需 数 据 的 两 种 形式 ， 即 共享 访问 
和 互 斥 访问 。 如 果 一 个 事务 不 会 改变 数据 项 ， 那 么 它 要 求 的 就 是 共享 访问 ， 这 就 意味 着 允许 其 
他 事务 看 到 该 数据 项 。 而 如 果 一 个 事务 要 改变 数据 项 ， 那 么 它 要 求 的 就 必须 是 互 斥 访问 ， 这 就 
意味 着 ， 只 有 该 事务 才能 访问 该 数据 项 。 

在 锁定 协议 中 ， 每 次 事务 请 求 访 问 数据 项 时 ， 它 还 必须 告诉 数据 库 管 理 系 统 它 所 需 的 访问 
类 型 。 如 果 事 务 请 求 的 是 对 一 个 数据 项 的 共享 访问 ， 那 么 不 论 这 个 数据 项 是 和 否 用 共享 锁 锁 定 ， 
这 个 访问 都 将 得 到 批准 ， 并 且 将 该 数据 项 用 共享 锁 进 行 标记 。 但 是 ， 如 果 被 请 求 的 数据 项 已 经 
用 排 它 锁 标 记 了 ， 那 么 别 的 访问 都 将 会 被 拒绝 。 如 果 事 务 对 数据 项 的 访问 要 求 是 互 斥 访问 ， 那 
么 只 有 在 这 个 数据 项 没有 被 锁定 的 情况 下 ， 请 求 才能 被 批准 。 通 过 这 样 一 种 方式 ， 一 个 准备 改 
动 数据 项 的 事务 就 可 以 通过 获得 的 互 斥 访问 ， 来 防止 别 的 事务 对 该 数据 项 的 干预 。 反 之， 如 果 
几 个 事务 都 不 会 改动 数据 项 ， 那 么 它们 就 能 够 对 这 个 数据 项 实现 共享 访问 。 当 然 ， 一 旦 事务 完 
成 了 对 数据 项 的 访问 ， 就 会 通知 数据 库 管 理 系统 ， 从 而 解除 相关 的 锁定 。 

当 出 现 事 务 的 访问 请 求 被 拒绝 的 情况 时 ， 可 以 用 许多 不 同 的 算法 进行 处 理 。 一 种 算法 就 是 
强制 事务 等 待 ， 直 至 所 请 求 的 项 可 用 为 止 ， 但 是 这 种 方法 容易 造成 死 锁 。 因 为 两 个 事务 要 求 对 
同样 的 两 个 数据 项 进行 互 斥 访问 的 时 候 ， 如 果 每 一 个 事务 都 获得 了 对 其 中 一 个 数据 项 的 互 斥 访 
问 权 限 ， 并 且 又 坚持 等 待 另 一 个 数据 项 ， 那 么 它们 就 会 出 现 阻塞 情况 。 为 了 避免 这 种 死 锁 的 发 
生 ， 有 些 数据 库 管 理 系 统 会 让 较 老 的 事务 优先 处 理 。 也 就 是 说 ， 如 果 一 个 较 老 的 事务 要 求 访问 
被 较 新 的 事务 锁定 的 数据 项 ， 那 么 那个 较 新 的 事务 就 会 被 迫 释 放 其 所 有 的 数据 项 ， 并 回 滚 它 的 
活动 (依据 日 志文 件 )。 于 是 , 较 老 的 事务 就 获得 了 对 所 需 数 据 项 的 访问 权限 ， 而 较 新 的 事务 只 
得 重新 开始 。 如 果 这 个 较 新 的 事务 一 直 被 抢占 ， 那 么 随 着 过 程 的 进展 它 也 会 变 老 ， 最 终 成 为 一 
个 较 老 的 具有 高 优先 级 的 事务 。 这 个 协议 ， 称 为 受伤 等 待 协议 (wound-wait protocol) ( 老 的 事务 将 
新 的 事务 挂 起 , 而 新 的 事务 等 待 变 成 老 的 事务 ), 这 样 就 能 保证 每 个 事务 最 终 都 能 完成 它 的 任务 。 


问题 与 练习 


1. 说 明 事务 到 达 了 它 的 提交 点 与 没 到 达 提 交点 的 区 别 是 什么 。 

. 数据 库 管理 系统 是 怎样 防止 大 量 的 级 联 回 滚 的 ? 

3. 假定 一 个 账户 的 初始 余额 是 400 美 元 。 有 两 个 事务 ， 一 个 事务 从 这 个 账户 中 支取 100 美 元 ， 另 一 个 事 
务 从 这 同一 账户 中 支取 200 美 元 。 请 说 明 ， 这 两 个 不 加 控制 的 交叉 事务 怎样 才能 使 账户 的 最 终 余额 为 
100 美 元 、200 美 元 和 300 美 元 。 

4. a. 简 述 事务 对 数据 库 中 的 数据 项 请 求 共享 访问 的 可 能 结果 。 

b. 简 述 事务 对 数据 库 中 的 数据 项 请 求 互 斥 访问 的 可 能 结果 。 

5. 试 描述 会 导致 执行 数据 库 系统 操作 的 事务 间 出 现 死 锁 的 一 系列 事件 。 

. 请 说 明 怎 样 打破 第 5 题 中 的 死 锁 情况 。 你 的 解决 办 法 是 否 要 用 到 数据 库 管理 系统 中 的 日 志文 件 ? 请 解 
释 你 的 答案 。 
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本 节 我 们 抛 开 多 维 数 据 库 系 统 的 研究 来 讨论 传统 的 文件 结构 。 这 些 结构 代表 了 数据 存储 和 
检索 系统 的 历史 开端 , 现在 的 数据 库 技术 就 是 由 此 发 展 而 来 的 。 为 这 些 结构 开发 的 许多 技术 (如 
索引 技术 和 散 列 技术 ) 是 构建 今天 大 规模 、 复 杂 数 据 库 的 重要 工具 。 


9.5.1 顺序 文件 


顺序 文件 〈sequential file) 是 这 样 的 一 种 文件 ， 它 从 头 到 尾 都 是 以 顺序 的 方式 进行 访问 的 ， 
好 像 文 件 中 的 信息 都 排 成 一 行 。 这 种 文件 的 例子 有 音频 文件 、 视 频 文件 、 包 含 程序 的 文件 和 包 
含 文本 文档 的 文件 等 。 事 实 上 ， 大 多 数 由 个 人 计算 机 用 户 创建 的 文件 都 是 顺序 文件 。 例 如 ， 当 
保存 一 个 电子 表格 时 ， 它 的 信息 就 会 作为 一 个 顺序 文件 进行 编码 和 保存 ， 电 子 表格 应 用 软件 能 
够 重新 构建 电子 表格 。 

文本 文件 是 顺序 文件 ， 它 的 每 个 逻辑 记录 是 用 ASCI 码 或 Unicode 码 编码 而 成 的 单个 符号 。 
文本 文件 常常 作为 一 种 基本 的 工具 ， 用 来 构建 诸如 员工 记录 文件 这 些 更 为 复杂 的 顺序 文件 。 为 
此 ， 只 需 建 立 一 个 统一 格式 ， 把 每 个 员工 的 信息 表示 为 一 串 文 本 ， 然 后 按照 格式 对 这 些 信息 进 
行 编 码 ， 接 下 来 就 把 这 些 员 工 记 录 一 个 接 一 个 地 记录 成 一 个 文本 串 。 例 如 ， 可 以 构建 这 样 的 一 
个 简单 的 员工 文件 ， 即 每 个 员工 记录 为 可 以 输入 31 个 字符 的 字符 串 ， 其 中 25 个 字符 作为 一 段 ， 
用 来 表示 员工 的 姓名 (填充 足够 多 的 空格 形成 25 字 符 的 字段 )， 随 后 6 个 字符 作为 一 段 ， 用 来 表 
示 员 工 的 工 号 。 最 终 的 文件 将 会 是 一 个 很 长 的 编码 过 的 字符 串 ， 其 中 每 31 个 字符 组 成 的 块 代表 
了 一 个 员工 的 信息 ( 见 图 9-14)。 从 文件 中 ， 我们 可 以 根据 由 31 个 字符 的 块 所 组 成 的 逻辑 记录 来 
实现 信息 检索 ， 每 个 块 中 的 各 个 字段 是 根据 构成 块 的 统一 格式 来 识别 的 。 


文件 由 一 串 块 组 成 ， 
每 个 块 含有 31 个 字符 

















二 
员工 姓名 员工 工 号 
图 9-14 ”以 文本 文件 实现 的 一 个 简单 的 员工 文件 结构 


顺序 文件 中 的 数据 必须 保持 文件 的 顺序 特性 记录 在 海量 存储 器 里 。 如 果 海 量 存储 系统 本 身 
具有 顺序 性 (如 磁带 和 CD)， 那 么 就 可 以 直接 做 到 这 一 点 。 我 们 只 需 根据 存储 介质 的 顺序 特性 ， 
将 文件 记录 到 存储 介质 中 。 然 后 ， 在 处 理 文件 时 ， 可 以 直接 按 文件 在 存储 介质 中 的 顺序 来 读 取 
和 处 理 文 件 内 容 。 播 放 音 频 CD 就 是 这 么 一 个 过 程 ， 其 中 音乐 作为 一 个 顺序 文件 ， 治 着 一 条 连续 
的 螺旋 型 轨道 ， 一 个 肩 区 接着 一 个 扇 区 进行 存储 。 

然而 ， 在 用 磁盘 存储 的 情况 下 ， 文 件 将 分 散在 不 同 的 扇 区 中 ， 因 而 会 以 各 种 顺序 来 检索 。 
为 了 保持 正确 的 顺序 ， 大 多 数 操作 系统 〈 更 准确 地 说 是 文件 管理 程序 ) 都 会 维护 一 张 存 储 文件 
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的 肩 区 列表 。 这 个 列表 ， 作 为 磁盘 目录 系统 的 一 部 分 与 文件 记录 在 同一 磁盘 上 。 即 使 文件 实际 
上 分 散 存 储 在 磁盘 的 不 同 部 分 ， 利 用 这 个 列表 ， 操 作 系 统 也 能 以 正确 的 顺序 检索 扇 区 ， 就 好 像 
文件 真 的 是 按 顺 序 存储 的 一 样 。 

顺序 文件 处 理 中 的 一 个 固有 问题 就 是 必须 要 检测 何 时 到 达 文 件 的 末尾 。 通 常 我 们 把 顺序 文 
件 的 末尾 称 为 文件 结束 (End-Of-File，EOF )。 有 许多 种 标识 EOF 的 方法 : 一 种 是 在 文件 的 末尾 
放置 一 个 专用 的 标记 一 一 哨兵 (sentinel);， 男 一 种 是 利用 操作 系统 的 目录 系统 中 的 信息 来 标识 
一 个 文件 的 EOF。 也 就 是 说 ， 由 于 操作 系统 知道 哪些 扇 区 包含 有 此 文件 ， 它 也 就 知道 这 个 文件 
在 什么 地 方 结束 。 一 个 小 公司 的 工资 单 处 理 就 是 使 用 顺序 文件 的 一 个 典型 例子 。 这 里 我 们 可 以 想 
象 出 一 个 顺序 文件 ， 它 由 一 系列 的 逻辑 记录 组 成 ,每 条 记录 都 包含 一 个 员工 的 薪水 信息 (如 姓名 、 
员工 工 号 、 工 资 等 级 等 )。 依 据 这 些 信息 就 能 定期 打印 出 支票 ， 每 检索 一 个 员工 的 记录 ， 就 能 计 
算出 该 员工 的 工资 ， 然 后 再 打出 相对 应 的 支票 。 处 理 这 样 一 个 顺序 文件 的 活动 ， 可 以 用 下 面 这 样 
的 语句 来 完成 : 


while (the EOF has not been reached): 





retrieve the next record from the file and process it 


当 顺 序 文件 中 的 逻辑 记录 用 键 字 段 来 标识 时 ， 文 件 通常 就 可 以 这 样 安排 ， 即 按照 由 键 〈 可 
能 是 字母 键 ， 也 可 能 是 数字 键 ) 确定 的 顺序 来 安排 文件 中 的 记录 。 这 样 一 种 安排 简化 了 文件 信 
息 的 处 理工 作 。 例 如 ， 假 定 处 理工 资 时 ， 要 求 依 据 考勤 单 的 信息 更 新 每 个 员工 的 记录 。 如 果 包 
含 考勤 单 记 录 的 文件 和 包含 员工 记录 的 文件 都 根据 同样 的 键 按照 同样 的 次 序 存 储 ， 那 么 ， 就 能 
顺序 地 访问 两 个 文件 来 进行 更 新 处 理 ， 即 用 从 一 个 文件 检索 到 的 考勤 单 来 更 新 另 一 个 文件 的 相 
应 记录 。 这 是 一 个 重大 改进 ， 因 为 如 果 文 件 不 按照 相应 次 序 来 存储 ， 就 必须 反复 地 搜索 ， 而 上 
述 方法 就 克服 了 这 个 缺点 。 所 以 ， 更 新 典型 的 顺序 文件 通常 需要 多 个 步骤 进行 处 理 。 首 先 ， 新 
信息 《如 考勤 单 中 的 信息 ) 记录 在 一 个 称 为 事务 文件 的 顺序 文件 中 ， 这 个 事务 文件 按照 要 被 更 
新 的 文件 〈 称 为 主 文件 ) 的 次 序 进 行 排序 ， 然 后 ， 通 过 从 两 个 文件 中 顺序 地 读 取 记 录 来 对 主 文 
件 记录 进行 更 新 。 

与 这 种 更 新 过 程 稍 有 不 同 的 是 归并 过 程 ， 即 把 两 个 顺序 文件 合并 成 一 个 包含 原来 两 个 文件 
记录 的 新 文件 。 假 定 两 个 输入 文件 的 记录 是 依据 一 个 公共 的 键 字段 按照 升序 来 排列 的 ， 并 假定 
归并 产生 的 输出 文件 也 是 按键 的 升序 来 排列 的 。 图 9-15 概 述 了 这 个 典型 的 归并 算法 。 其 基本 思 
想 是 顺序 地 扫描 两 个 输入 文件 ， 从 而 构建 出 输出 文件 〈 见 图 9-16)。 


def MergeFiles (InputFileA, InputFileB, OutputFile) 
if£ (两 个 输入 文件 都 在 EOF): 
停止 ， OutputFile 为 空 。 
if (InputFileA 不 在 EOF): 
声明 它 的 第 一 个 记录 为 它 的 当前 记录 。 
if (InputFileB 不 在 EOF): 
声明 它 的 第 一 个 记录 为 它 的 当前 记录 。 
while (两 个 输入 文件 都 不 在 EOF) : 


将 键 字段 值 \ 较 小 的 “当前 记录 放 在 0utputFile 中 。 
if (该 当前 记录 是 其 对 应 输入 文件 的 最 后 一 个 记录 ) : 
声明 该 输入 文件 在 EOF 。 


else : 
声明 该 输入 文件 中 的 下 一 个 记录 是 该 文件 的 当前 记录 。 
从 不 在 EOF 的 输入 文件 的 当前 记录 开始 复制 
其 余 记 录 到 OutputFile。 





图 9-15 ”归并 两 个 顺序 文件 的 函数 
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输出 文件 





Co 


LP 





图 9-16 ”归并 算法 的 应 用 (字母 用 于 代表 整 条 记录 ， 具 体 字母 表示 记录 的 键 字 段 的 值 ) 
9.5.2 索引 文件 


对 于 数据 处 理 的 次 序 就 是 其 文件 存储 次 序 的 情况 ， 顺 序 文件 是 存储 这 类 数据 的 理想 选择 。 
然而 ， 当 记录 必须 以 一 种 不 可 预测 的 次 序 进行 检索 时 ， 那 么 这 种 文件 的 效率 就 不 高 了 。 在 这 种 
情况 下 ， 需 要 一 种 方法 来 快速 确定 所 需 罗 辑 记 录 的 位 置 。 一 种 流行 的 方法 就 是 使 用 文件 索引 ， 
这 种 方式 与 书本 里 的 索引 用 来 定位 主题 在 书 中 位 置 的 方式 非常 一 致 。 这 种 文件 系统 称 为 索引 文 
件 (indexed file )。 

文件 的 索引 包含 存储 在 该 文件 中 的 键 的 列表 和 指示 包含 每 个 键 的 记录 存储 位 置 的 项 。 这 样 
一 来 ， 为 了 要 找到 某 个 记录 ， 首 先 需 要 在 索引 中 找到 标识 键 ， 然 后 再 检索 存储 在 该 键 相关 位 置 
处 的 信息 块 。 

文件 的 索引 通常 作为 一 个 单独 的 文件 与 被 索引 的 文件 存储 在 同一 个 海量 存储 设备 里 。 在 文 
件 处 理 开始 之 前 ， 通 常 要 先 将 索引 传送 到 主 存 储 器 中 ， 以 便 在 需要 访问 文件 中 的 记录 时 ， 能 很 
容易 地 访问 到 《〈 见 图 9-17)。 

在 维护 员工 记录 时 就 有 索引 文件 的 一 个 典型 例子 。 当 想 检 索 一 个 员工 的 记录 时 ， 使 用 索引 
可 以 避免 元 长 的 搜索 操作 。 具 体 来 说 ， 如 果 员工 记录 的 文件 用 员工 工 号 进行 索引 ， 那 么 只 要 知 
道 员 工 的 工 号 ， 就 能 很 快 查 到 该 员工 的 记录 。 另 一 个 例子 是 音频 CD 的 播放 ， 利 用 索引 能 较 快 地 
访问 到 各 个 录音 。 

多 年 以 来 ， 在 基本 索引 概念 的 基础 上 ， 已 经 使 用 了 许多 不 同 的 索引 技术 。 构 建 索引 的 一 种 
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方式 是 运用 层次 化 的 方式 ， 以 便 索 引 呈 现 出 分 层 结构 或 树 结构 。 最 突出 的 例子 就 是 大 多 数 操作 
系统 为 组 织 文件 存储 所 采用 的 分 层 目 录 系 统 。 在 这 种 情况 下 ， 目 录 《〈 即 文件 夹 ) 起 的 是 索引 的 
作用 ， 而 每 个 索引 又 包含 了 指向 其 子 索 引 的 链接 。 从 这 个 角度 来 看 ， 整 个 文件 系统 只 是 一 个 大 
型 的 索引 文件 。 
当 索 引文 件 被 打 
主 存储 器 开 时 ， 索 引 被 传 海量 存储 器 
送 到 主 存储 器 






索引 作为 一 个 独 
立 的 文件 存储 在 
海量 存储 器 中 


图 9-17 打开 索引 文件 
9.5.3 散 列 文件 


尽管 索引 技术 为 访问 数据 存储 结构 中 的 数据 项 提供 了 一 种 较 快 的 访问 机 制 ， 但 维护 索引 的 
开销 也 比较 大 。 散 列 〈hashing) 技术 也 能 提供 类 似 的 访问 效果 ， 但 无 须 那 样 大 的 开销 。 与 索引 
系统 的 情况 一 样 ， 散 列 技术 也 是 利用 键 值 来 定位 记录 。 但 是 散 列 技术 并 不 是 从 索引 中 查找 键 ， 
而 是 直接 通过 键 确定 记录 的 位 置 。 

散 列 系统 可 以 概括 如 下 : 数据 存储 空间 被 分 成 几 个 称 为 存储 桶 〈bucket) 的 区 ， 每 个 桶 能 
放 几 条 记录 。 根 据 将 键 的 值 转换 为 桶 号 的 算法 ， 可 以 将 记录 分 散 存 储 在 这 些 桶 中 。 这 里 ， 将 键 
的 值 转换 为 桶 号 的 算法 称 为 散 列 函数 (hash function)。 每 条 记录 就 存储 在 通过 这 样 处 理 标识 的 
桶 里 。 因 此 ， 要 检索 一 条 已 经 置 于 这 种 存储 结构 中 的 记录 ， 首 先 要 对 该 记录 的 标识 键 应 用 散 列 
函数 ， 以 确定 相应 的 桶 ， 然 后 检索 桶 中 内 容 ， 最 后 从 检索 的 数据 中 搜索 所 需要 的 记录 。 

散 列 不 仅 能 用 作 从 海量 存储 器 中 检索 数据 的 方法 ， 也 能 用 作 从 存储 在 主 存储 器 中 的 大 数据 
块 中 检索 数据 项 的 方法 。 当 将 散 列 用 在 海量 存储 器 中 的 存储 结构 时 ， 得 到 的 结果 称 为 散 列 文件 
(hash file)。 当 将 散 列 用 在 主 存储 器 中 的 存储 结构 时 ， 得 到 的 结果 通常 称 为 散 列 表 《〈hash table )。 





获 列 法 不 只 是 用 来 作为 构建 高 效 数 据 存储 系统 的 一 种 方法 。 例 如 ， 散 列 法 还 可 以 用 作 认 
证 因特网 上 传送 消息 的 一 种 方法 。 其 基本 思想 是 : 以 秘密 方式 对 消息 进行 散 列 运算 ， 然 后 将 
得 到 的 值 与 消息 一 起 传送 ， 为 了 认证 消息 ， 接 收 方 对 收 到 的 消息 进行 用 列 处 理 (以 同样 的 和 





方式 )， 并 确认 得 到 的 值 与 原始 值 一 致 。( 这 里 假定 经 过 散 列 处 理 后 得 到 相同 的 值 ， 而 消息 


发 生 政变 的 可 能 性 很 小 。) 如 果 得 到 的 值 与 原来 的 值 不 一 臻 ， 就 认为 该 消息 已 被 破坏 . 那些 对 
此 感 兴趣 的 人 可 能 希望 从 因特网 上 搜索 有 关 MD5 的 信息 ， 其 实 MD5 是 在 认证 应 用 领域 有 着 广 
人 


。 错误 检测 转 术 可 以 看 作 才 到 法 在 认证 领 的 一 种 应 用 ， 其 实 已 经 是 一 目 了 然 的 事 了 。 例 
用 本 上 就 是 一 个 散 列 系统 ， 在 此 系统 中 ， 位 模式 只 散 列 为 0 或 1， 然 后 将 这 
位 模式 一 起 传送 。 TE A se 
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现在 我 们 把 散 列 技术 运用 在 典型 的 员工 文件 中 ， 这 里 ， 每 条 记录 包含 的 都 是 公司 中 一 个 员 
工 的 信息 。 首 先 ， 在 海量 存储 器 中 创建 几 个 可 用 的 区 域 ， 用 来 实现 桶 的 功能 。 至 于 如 何 设计 决 
定 桶 的 数目 和 每 个 桶 的 大 小 , 稍 后 再 讨论 。 现 在 , 我 们 假定 已 创建 了 41 个 桶 , 桶 号 从 0 一 直到 40。 
(我 们 选择 41 个 桶 ， 而 不 是 偶数 40 个 桶 ， 原 因 稍 后 再 解释 。) 

现在 我 们 假设 用 员工 工 号 来 作为 标识 员工 记录 的 键 。 然 后 ， 下 一 步 工 作 就 是 开发 一 个 散 列 
函数 ， 把 这 些 键 转换 成 桶 号 。 虽 然 员工 工 号 可 能 是 25X3Z 或 J2X35 这 样 的 格式 ， 不 是 数字 型 的 ， 
但 它们 是 以 位 模式 存储 的 ， 我 们 能 够 将 这 些 位 模式 解释 成 数字 ， 利 用 这 个 数字 解释 ， 就 能 让 任 
何 一 个 键 去 除 以 可 用 的 桶 号 , 然后 记 下 余数 。 在 这 个 例子 中 , 余数 将 是 0 一 40 的 一 个 整数 。 因 此 ， 
我 们 就 可 以 用 每 次 做 除法 得 到 的 余数 来 确定 41 个 桶 中 的 一 个 〈 见 图 9-18 )。 


ASCI[ 表 示 : “0011001000110101010110000011001101011010 
十 进 制 的 等 价值: i 








图 9-18 ”将 键 字 段 值 25X3Z 散 列 到 41 个 桶 中 的 一 个 


以 此 作为 我 们 的 散 列 函数 ， 接 下 来 再 分 别 考虑 每 条 记录 ， 继 续 构 建文 件 。 通 过 使 用 散 列 函 
数 对 其 键 除 以 41 得 到 一 个 桶 号 ， 然 后 再 把 该 记录 存储 在 这 个 桶 中 《〈 见 图 9-19)。 以 后 ， 我 们 需要 
检索 记录 时 ， 只 需 将 这 个 散 列 函数 应 用 到 该 记录 的 键 ， 以 确定 相应 的 桶 号 ， 然 后 就 可 以 从 这 个 
桶 里 搜索 所 要 的 记录 。 


1 2 0 

41)55 41) 她 41714 

41 82 0 

a 
余数 


当 除 以 41 时 ， 键 字段 值 14.55.96 都 得 
到 余数 14， 所 以 这 些 记录 存放 在 桶 14 中 


六 95 136 


#13 


| | [et 


#15 #16 


图 9-19 ” 散 列 系统 的 基本 原理 


现在 ， 让 我 们 来 重新 考虑 一 下 把 存储 区 分 成 41 个 桶 的 问题 。 首 先 注意 ， 要 想得到 一 个 有 效 
的 散 列 系统 ， 要 存储 的 记录 应 当 均 匀 地 分 布 在 这 些 桶 中 。 如 果 一 个 不 成 比例 的 键 数目 恰巧 散 列 
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到 同一 个 桶 里 一 一 这 种 现象 被 称 为 群集 (clustering) 一 一 那么 ， 在 一 个 桶 里 就 会 存 入 不 成 比例 
数目 的 记录 。 结 果 是 ， 从 这 个 桶 里 检索 一 条 记录 就 会 花费 更 多 的 搜索 时 间 ， 这 也 就 失去 了 散 列 
技术 的 优势 。 

现在 再 来 看 ， 如 果 我 们 选择 把 存储 区 域 分 成 40 个 桶 ， 而 不 是 41 个 桶 ， 那 么 散 列 函数 涉及 的 
除数 《〈 即 除 键 的 值 ) 就 是 40， 而 不 是 41。 但 是 ， 如 果 被 除数 和 除数 有 一 个 公 因 子 ， 那 么 这 个 公 
因子 也 会 出 现在 余数 中 。 具 体 来 说 ， 如 果 存 储 在 散 列 文件 中 的 数据 项 的 键 碰 巧 都 是 5 的 倍数 (也 
是 40 的 约 数 )， 那 么 当 用 40 来 除 时 ，5 这 个 因子 就 会 出 现在 余数 中 ， 并 且 数 据 项 就 会 群集 到 与 余 
数 0、5、10、15、20、25、30 及 35 相 对 应 的 那些 桶 里 。 类 似 的 情况 还 会 出 现在 键 是 2、4、8、10 
及 20 的 倍数 的 情形 中 ， 因 为 它们 也 都 是 40 的 约 数 。 因 此 ， 我 们 选择 把 存储 区 域 分 成 41 个 桶 ， 因 
为 41 是 素数 ， 选 择 它 ， 就 可 以 消除 公约 数 ， 从 而 减少 群集 的 可 能 性 。 

但 是 ， 和 群集 的 可 能 性 绝对 不 能 完全 消除 ， 即 使 用 的 是 精心 设计 的 散 列 函数 ， 在 文件 构建 
过 程 的 早期 ， 还 是 非常 有 可 能 存在 两 个 键 经 过 散 列 后 ， 得 到 同一 个 值 的 情况 。 这 个 现象 被 称 为 
碰撞 。 为 了 理解 其 中 的 原因 ， 考 虑 下 面 的 情况 。 

假设 我 们 已 经 建立 了 一 个 在 41 个 桶 中 随机 分 配 记录 的 散 列 函数 , 这 时 候 的 存储 系统 是 空 的 ， 
并 且 准 备 一 次 插入 一 条 新 记录 。 当 插入 第 一 条 记录 时 ， 它 将 会 被 放 进 一 个 空 桶 里 。 然 而 ， 当 插入 
第 二 条 记录 时 , 41 个 桶 中 还 有 40 个 桶 是 空 的 , 这 样 一 来 , 第 二 条 记录 被 放 进 空 桶 的 概率 只 有 40/41。 
假设 第 二 条 记录 被 放 进 了 一 个 空 桶 ， 那 么 当 放 第 三 条 记录 时 就 只 能 找到 39 个 空 桶 ， 所 以 ， 被 放 
进 空 桶 的 概率 是 39/41。 继 续 这 个 过 程 ， 就 可 以 发 现 ， 如 果 前 7 条 记录 都 被 放 进 了 空 桶 ， 那 么 第 
八条 记录 被 放 进 余下 空 桶 的 概率 就 只 有 34/41。 

基于 以 上 的 分 析 , 我 们 就 能 计算 出 所 有 前 8 条 记录 都 被 放 进 空 桶 的 概率 ， 即 每 条 记录 被 放 入 
空 桶 概率 的 乘积 ， 这 里 假设 前 面 的 记录 都 已 被 放 入 空 桶 。 那 么 这 个 概率 为 

(41 / 41)(40 / 41)(39 / 41)(G38 / 41)..(34 7 41)=0.482 
问题 是 这 个 结果 小 于 一 半 。 也 就 是 说 ， 当 在 41 个 桶 里 分 配 记录 时 ， 很 可 能 在 存储 第 八条 记录 的 
时 候 ， 就 会 发 生 碰撞 现象 。 

发 生 碰 撞 的 高 概率 表明 ， 不 管 如 何 精心 选择 散 列 函数 ， 设 计 任 何 一 个 散 列 系统 时 都 必须 要 
考虑 到 群集 现象 。 特 别 是 ， 一 个 桶 有 可 能 会 装 满 或 者 溢出 。 这 种 问题 的 一 种 解决 方法 就 是 ， 人 允 
许 扩 展 桶 的 大 小 。 男 一 种 解决 方法 是 ， 允许 桶 溢出 到 一 个 专门 为 解决 这 种 问题 而 保留 的 溢出 区 。 
无 论 如 何 ， 群 集 情况 和 溢出 情况 的 出 现 都 将 使 散 列 文件 的 性 能 明显 降低 。 

研究 表明 ， 作 为 一 般 规律 ， 只 要 记录 的 数目 与 文件 中 总 的 记录 容量 之 比 一 一 将 这 个 比率 称 
为 负载 因子 (load factor) 保持 在 50% 以 下 ， 那 么 散 列 文件 就 会 表现 出 良好 的 性 能 。 但 是 ， 
如 果 负 和 载 因 子 攀升 至 超过 75%， 那 么 系统 的 性 能 通常 就 会 降低 (严重 的 群集 现象 会 造成 有 些 桶 
装 满 甚 至 溢出 )。 由 于 这 个 原因 ， 如 果 散 列 存储 系统 的 负载 因子 接近 75% 这 个 值 ， 那 么 它 通常 会 
以 一 个 更 大 的 容量 进行 重建 。 最 后 得 出 结论 ， 通 过 实现 散 列 系统 来 获得 记录 检索 的 高 效率 是 需 
要 花费 一 定 代价 的 。 





问题 与 练习 
. 依据 图 9-15 所 示 的 归并 算法 ， _ 假设 一 个 输入 文件 包含 键 字 段 值 等 于 B 和 E 的 记录 ， 而 另 一 个 输入 文件 
包含 A、C、D 和 F， 试 归并 这 两 个 文件 。 
2 ci et ig ho he ed ee a a 0 
项 ? 下 
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4. 从 索引 文件 中 检索 记录 需要 哪些 步骤 ? ee wm 
5. 试 说 明 ， 如 果 选 取 了 不 恰当 的 散 列 函数 ， 其 数列 存储 系统 的 性 能 不 比 顺 序 文件 优 越 ， 
6. 假设 一 个 散 列 存储 系统 是 用 文中 提 到 的 除法 散 列 函数 构建 的 ， 但 是 这 里 只 用 6 个 存储 栖 。 对 
值 ， 确 定 相应 记录 应 该 放 进 哪个 桶 。 会 出 现 什么 问题 ? 为 什么 ? ” | 
a.24 b.30 el ee ee, 
f.21 g.9 .39 1 2 iQ a 
7. 要 想 出 现 两 个 人 的 生日 在 同一 天 的 可 能 性 ， 至 少 需 要 多 少 人 ? 试 说 明 这 个 问 是 与 本 节 内 容 有 何 关系 ? 人 
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9.6 ”数据 挖掘 


一 个 迅速 发 展 的 并 与 数据 库 技术 紧密 相关 的 学 科 就 是 数据 挖掘 , 它 包 括 了 在 数据 集 上 发 
ev 数据 挖掘 已 经 成 为 许多 领域 的 重要 工具 ， 包 括 市 场 营销 、 库 存 管 理 、 质 量 控 

、 借 贷 风 险 管理 、 坎 诈 检 测 和 投资 分 析 等 。 数 据 挖掘 技术 甚至 可 以 运用 于 那些 似乎 不 大 
能 会 用 到 的 场合 ， 如 用 于 确定 某 些 以 DNA 分 子 进行 编码 的 基因 功能 以 及 描述 有 机 组 织 包 
特性 。 

数据 挖掘 活动 与 传统 的 数据 库 查 询 不 同 ， 原 因 在 于 数据 挖掘 所 做 的 工作 是 设法 确定 以 前 未 
知 的 模式 ， 而 传统 数据 库 需 要 做 的 只 是 检索 已 经 存储 好 了 的 事实 。 此 外 ， 数 据 挖掘 操作 的 是 静 
态 的 数据 集合 ， 称 为 数据 仓库 (data warehouse)， 而 不 是 经 常 要 更 新 的 “联机 ”运行 的 数据 库 。 
这 些 仓库 往往 是 数据 库 或 数据 库 集 的 “快照 ” 因为 在 静态 系统 中 寻找 模式 要 比 在 动态 系统 中 简 
单 ， 所 以 用 它们 来 奉 代 实 际 运行 的 数据 库 。 

还 需要 注意 的 是 ， 数 据 挖掘 的 主题 不 单 局 限于 计算 领域 ， 而 且 还 涉及 统计 学 领域 。 事 实 上 ， 
很 多 人 认为 ， 由 于 数据 挖掘 源 自 于 试图 对 大 量 不 同 的 数据 集 进 行 统计 分 析 ， 因 而 它 更 像 是 统计 
学 的 一 种 应 用 ， 而 并 非 计 算 机 科学 的 一 个 领域 。 

数据 挖掘 有 两 种 常见 的 形式 : 类 描述 (class description) 和 类 识别 〈class discrimination )。 
类 描述 用 来 找 出 描绘 一 组 数据 项 的 属性 ， 而 类 识别 用 来 找 出 区 分 两 组 数据 项 的 属性 。 例 如 ， 类 
描述 技术 可 以 用 来 发 现 购买 经 济 型 轿车 的 人 的 特点 ， 而 类 识别 技术 可 以 用 来 发 现 能 区 分 买 二 手 
车 与 买 新 车 的 顾客 的 特性 。 










生怕 化 学 路 径 ) 的 这 样 一 此 研究 人 起 学 是 生物 和 
地 例证 了 计算 机 科学 是 如 何 影 响 其 至 扎根 于 其 他 领域 的 。 


另 一 种 数据 挖 据 的 形式 是 聚 类 分 析 (cluster analysis)， 它 用 来 发 现 类 型 。 注 意 ， 这 与 类 描 
述 不 同 ， 类 描述 是 用 来 发 现 已 经 确定 的 类 型 中 成 员 的 属性 。 更 明确 地 说 ， 聚 类 分 析 试 图 找到 那 
些 能 引导 发 现 组 群 的 数据 项 的 特性 。 例如, 在 分 析 观 看 某 个 运动 图 像 的 观众 年 龄 信息 的 过 程 中 ， 
通过 聚 类 分 析 可 能 会 发 现 ， 观 众 会 分 成 两 个 年 龄 组 ， 即 4 一 10 岁 一 组 和 25 一 40 岁 一 组 。( 也 许 这 
个 运动 图 像 吸 引 了 孩子 和 他 们 的 父母 ? ) 

还 有 一 种 数据 挖掘 的 形式 ， 称 为 关联 分 析 (association analysis)， 它 的 工作 是 寻找 两 个 数据 
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组 之 间 的 联系 。 使 用 关联 分 析 的 例子 有 ， 找 到 既 买 土豆 片 又 买 啤酒 和 饮料 的 顾客 ， 或 者 既 在 正 
常 的 工作 日 购物 又 能 享受 退休 优惠 的 顾客 。 

孤立 点 分 析 (outlier analysis) 是 数据 挖掘 的 另 一 种 形式 ， 它 试图 识别 出 不 符合 规则 的 数 
据 项 。 孤立 点 分 析 可 以 用 于 识别 数据 集中 的 错误 ; 用 于 通过 检测 信用 卡 是 否 突 然 偏离 客户 
的 正常 消费 模式 ,识别 信用 卡 是 否 被 盗用 ; 甚至 可 以 通过 发 现 反常 的 行为 识别 出 潜在 的 恐 
怖 分 子 。 

最 后 ， 还 有 一 种 数据 挖掘 形式 ， 称 为 序列 模式 分 析 〈sequential pattern analysis)， 它 试图 识 
别 随时 间 变 化 的 行为 模式 。 例 如 ， 序 列 模式 分 析 可 以 揭示 股票 市 场 等 经 济 系统 中 的 趋势 ， 或 者 
气候 环境 等 环境 系统 中 的 趋势 。 

最 后 这 个 例子 表明 ， 数 据 挖 据 的 结果 可 以 用 来 预测 未 来 的 行为 。 如 果 一 个 实体 具有 表征 某 
个 类 的 属性 ， 那 么 这 个 实体 就 可 能 表现 为 这 个 类 的 成 员 。 然 而 ， 许 多 数据 挖掘 项 目 只 是 旨 在 获 
得 对 数据 的 更 好 理解 ， 如 利用 数据 挖 抉 来 解 开 DNA 之 谜 。 无 论 如 何 ， 数 据 挖 气 具 有 巨大 的 潜在 
应 用 领域 ， 并 且 有 望 成 为 未 来 一 个 活跃 的 研究 领域 。 

注意 ， 数 据 库 技术 和 数据 挖掘 之 间 的 关系 就 像 堂 兄弟 一 样 ， 因 此 一 个 领域 的 研究 成 果 在 另 
一 个 领域 也 会 有 反映 。 数 据 库 技术 广泛 运用 ， 使 得 数据 仓库 具有 以 数据 立方 (data cube， 从 多 
角度 看 待 数据 ， 用 立方 这 个 术语 来 推测 多 维 图 像 ) 形式 表示 数据 的 能 力 ， 这 就 使 得 数据 挖掘 成 
为 可 能 。 反 过 来 ， 当 数据 挖掘 方面 的 研究 人 员 提 高 了 实现 数据 立方 的 技术 时 ， 这 些 成 果 也 给 赤 
据 库 设计 领域 带 来 了 好 处 。 

最 后 ， 我 们 应 当 认 识 到 ， 成 功 的 数据 挖掘 远 不 止 包 括 数据 集 范 围 内 的 模式 识别 。 还 要 应 用 
明智 的 判断 来 确定 哪些 模式 是 有 实际 意义 的 ， 哪 些 只 是 偶然 的 。 某 个 便利 店 卖 出 了 大 量 中 奖 彩 
票 这 样 一 个 事实 对 于 计划 买 彩票 的 某 个 人 来 说 ， 可 能 不 会 有 什么 重要 意义 ， 但 是 对 于 食品 杂货 
店 经 理 来 说 ， 发 现 有 些 买 了 快餐 的 顾客 也 常会 买点 冷冻 食品 ， 那 就 是 一 条 很 有 意义 的 信息 了 。 
同样 ， 数 据 挖 掘 也 包括 了 大 量 的 伦理 问题 ， 包 括 在 数据 仓库 中 表述 的 个 体 的 权利 、 所 得 结论 的 
准确 性 和 用 处 ， 甚 至 涉及 数据 挖掘 初衷 是 否 恰 当 。 


问题 与 练习 i 

1. 为 什么 数据 挖掘 不 在 “联机 ”数据 库 上 实施 ? 

2. 试 举 出 另 一 个 模式 的 例子 ， 其 中 包含 文中 提 到 的 每 种 数据 挖 气 类 型 。 
3. 给 出 在 挖掘 销售 数据 时 数据 立方 可 能 会 允许 的 几 种 不 同 观点 。 

4 数据 挖 气 与 传统 数据 库 查 询 有 何不 同 ? 


9.7 数据库 技 术 的 社会 影响 


随 着 数据 库 技术 的 发 展 ， 以 往 那 些 埋藏 在 秘密 记录 里 的 信息 现在 都 是 可 获取 的 了 。 许 多 情 
况 下 ， 自 动 化 图 书馆 系统 记录 了 每 个 用 户 的 阅读 记录 ， 零 售 商 保存 了 每 个 客户 的 购买 记录 ， 因 
特 网 搜索 引擎 保留 了 客户 端的 请 求 记录 。 而 且 ， 这 些 信息 对 营销 公司 、 执 法 机 构 、 政 党 、 雇 主 
以 及 个 人 也 具有 潜在 的 价值 。 

这 代表 了 渗透 到 数据 库 应 用 整个 范围 的 潜在 问题 。 基 于 现在 的 技术 ， 收 集 大 量 的 数据 、 合 
并 或 比较 不 同 的 数据 集合 以 获得 它们 之 间 的 关系 ， 变 得 非常 容易 ， 而 这 些 信息 以 前 则 是 不 可 获 
取 的 。 所 带 来 的 影响 〈 既 有 正面 的 又 有 负面 的 ) 非常 巨大 ， 它 们 不 仅 是 学 术 界 辩论 的 主题 ， 更 
是 真实 存在 的 事实 。 
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现在 的 数据 收集 工作 在 有 些 情 况 下 比较 明显 ， 而 在 有 些 情况 下 就 显得 比较 微妙 了 。 前 一 种 
情况 的 例子 是 直接 要 求 某 人 提供 信息 。 这 可 能 以 自愿 的 方式 进行 ， 如 民意 调查 或 竞赛 登记 等 形 
式 ; 也 可 能 以 非 自愿 的 方式 进行 ， 如 以 政府 规定 强制 进行 等 。 有 时 ， 自 愿 与 否 取 决 于 个 人 的 观 
点 。 当 申请 借贷 时 提供 个 人 信息 ， 是 自愿 还 是 非 自 愿 ? 这 种 不 同 取决 于 获得 贷款 是 为 了 方便 还 
是 必需 的 。 现 在 有 些 零 售 店 使 用 信用 卡 时 ， 要 求 以 数字 化 格式 记录 签名 。 同 样 ， 提 供 这 种 信息 
是 否 自 愿 ， 也 是 取决 于 所 处 的 环境 。 

数据 收集 比较 微妙 的 情况 下 ， 就 避免 了 与 对 象 直接 进行 交流 。 这 样 的 例子 有 : 信用 卡 公司 
记录 下 了 信用 卡 持 有 者 的 所 有 购物 活动 ， 网 站 记录 下 了 访问 者 的 身份 ， 社 会 活动 家 记录 下 了 停 
在 目标 单位 停车 场 的 汽车 的 车 牌号 。 在 这 些 情 况 下 ， 数 据 收集 的 对 象 不 会 意识 到 他 们 的 信息 被 
收集 ， 更 不 大 可 能 知道 存在 为 此 建立 的 数据 库 。 

有 时 ， 只 要 一 个 人 停 下 来 想 想 ， 这 种 潜在 的 数据 收集 活动 就 很 清楚 了 。 例 如 ， 杂 货 店 可 能 
会 为 已 经 登记 过 的 常客 提供 折扣 。 登 记过 程 中 可 能 要 发 一 个 身份 认证 卡 ， 在 购物 时 要 出 示 该 卡 
才能 享受 折扣 。 这 样 商 店 就 可 以 收集 大 量 客 户 的 购物 记录 ， 而 这 种 记录 的 价值 远 远 超出 了 折扣 
的 价值 。 

当然 ， 推 动 数据 收集 繁 茉 发 展 的 动力 就 是 数据 的 价值 ， 它 的 作用 因数 据 库 技 术 的 发 展 而 得 
到 扩大 ， 这 些 数据 库 技术 使 数据 能 够 联系 起 来 ， 这 就 揭示 出 了 原本 隐藏 的 信息 。 例 如 ， 对 信用 
卡 持 有 者 的 消费 模式 进行 分 类 和 交叉 列表 ， 就 能 获得 极 具 市 场 价值 的 顾客 资料 概况 。 健 美 杂志 
的 订阅 单 可 以 寄 给 那些 最 近 买 过 健身 器 材 的 人 ， 而 台 狗 杂志 的 订阅 单 则 可 寄 给 那些 前 不 久 买 过 
狗 食 的 人 。 有 时 , 信息 的 组 合 方式 实在 是 富有 想象 力 。 如 将 犯罪 记录 与 社会 福利 记录 进行 对 比 ， 
可 以 找到 和 抓获 假释 期 间 的 违法 者 ;1984 年 美国 的 义务 兵役 机 构 利 用 从 一 家 著名 的 冰淇淋 店 获 
得 的 生日 登记 表 ， 找 出 了 那些 逃避 兵役 登记 的 公民 。 

有 一 些 办 法 能 够 用 来 保护 社会 ， 防 止 数据 库 滥用 。 一 种 办 法 就 是 通过 法 律 手段 。 但 是 ， 通 
过 一 个 法 案 来 反对 一 种 行为 ， 仅 仅 是 让 这 种 行为 不 合法 ， 但 阻止 不 了 行为 的 发 生 。 最 好 的 例子 
是 1974 年 美国 通过 的 《隐私 权 法 案 》(Privacy Act)， 其 目的 是 保护 公民 ， 防 止 政府 滥用 数据 库 。 
该 法 案 中 一 个 条 款 规定 政府 部 门 要 在 《联邦 公报 》(Federal Register) 上 公布 其 数据 库 通告 ， 允 
许 公民 访问 和 纠正 他 们 的 个 人 信息 。 然 而 ， 政 府 部 门 却 迟 迟 不 能 遵照 这 个 条 款 。 这 倒 并 非 一 定 
说 明 那 些 部 门 是 出 于 什么 恶意 的 目的 ， 在 许多 情况 下 ， 是 属于 官僚 作风 的 问题 。 但 是 ， 官 僚机 
构 构 建 的 人 事 数据 库 不 能 有 效 鉴别 身份 这 样 一 个 事实 ， 却 是 令 人 不 安 的 。 

男 一 个 也 许 更 有 效 的 、 控 制 数据 库 滥用 的 办 法 是 公众 熏 论 。 如 果 损 失 大 于 好 处 ， 人 们 就 不 
会 去 滥用 数据 库 ， 而 且 ， 企 业 最 害怕 的 惩罚 就 是 负面 的 公众 舆论 ， 因 为 这 将 直击 要 害 。20 世 纪 
90 年 代 初 期 ， 正 是 公众 舆论 阻止 了 一 些 主要 征 信和 局 为 商业 用 途 出 售 其 邮件 列表 。 更 近 一 点 的 例 
子 ， 谷 歌 公 司 于 2011 年 停止 了 它 的 Google Buzz 社 交 网 络 工 具 ， 此 前 ， 这 个 工具 对 流行 的 Gmail 
工具 中 联系 人 信息 的 自动 共享 受到 了 公众 的 严厉 批评 。 即 使 是 政府 机 构 也 会 向 公众 与 论 妥协 。 
1997 年 ， 美 国 社会 保障 局 (Social Security Administration) 修改 了 通过 因特网 查阅 社会 保障 记录 
的 计划 ， 这 是 因为 公众 舆论 对 信息 的 安全 性 产生 了 质疑 。 有 些 情 况 下 ， 几 天 就 能 得 到 结果 ， 这 
与 需要 经 过 见长 法 律 程序 才能 得 到 结果 的 情况 形成 了 鲜明 的 对 比 。 

当然 ， 在 许多 情况 下 ， 数 据 的 持 有 者 和 数据 的 主体 都 受益 于 数据 库 应 用 ， 但 是 在 所 有 情况 
下 ， 都 不 能 轻视 隐私 的 丢失 。 当 信息 准确 时 ， 私 密 性 问题 就 比较 严重 ， 而 当 信 息 错误 时 ， 秘 密 
性 问题 就 会 变 得 硕大 无 比 。 当 意识 到 自己 的 信用 评级 受到 了 错误 信息 的 负面 影响 时 ， 你 可 以 想 
象 出 那 种 无 望 的 感觉 。 不 难 想象 ,在 一 个 错误 信息 很 容易 被 传 开 的 环境 里 ， 问 题 会 怎样 地 扩大 。 
一 般 来 说 ， 秘 密 性 问题 是 并 且 仍 将 是 技术 《特别 是 数据 库 技 术 ) 进步 带 来 的 一 个 主要 副作用 。 
要 解决 这 些 问 题 就 需要 我 们 成 为 有 素质 的 、 警 觉 的 、 积 极 的 公民 。 
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问题 与 练习 


1. 应 该 为 了 确认 入 们 是 否 有 犯罪 倾向 而 赋予 执法 部 门 访问 数据 库 的 权利 吗 ? 即使 这 些 人 可 能 并 无 前 科 。 
2. 应 该 为 了 确认 人 们 是 否 有 潜在 的 健康 问题 而 赋予 保险 公司 访问 数据 库 的 权利 吗 ? 即 使 这 些 人 并 无 任 


” 何 症状 。 


3 假设 你 的 经 济 情况 良好 如 果 这 个 信息 在 很 多 机 构 传 开 ， 那 么 你 会 从 中 获得 什么 好 处 ? 同样 信息 的 
”散布 ， 又 会 有 什么 不 利 ?又 车 你 的 经 济 情况 不 理想 ， 结 果 又 将 如 何 ? 





复习 题 


Tr me ee 


4 nt ed De pe nh 《例如 ， 和 


-一 一 一 一 一 一 一 一 = 一 一 一 一 -一 一 





〈 带 * 的 题目 涉及 选读 章节 的 内 容 。) 


LU) 


. 概述 平面 文件 与 数据 库 之 间 的 不 同 。 
2: 
. 在 数据 库 实现 的 层次 化 方法 中 ,数据 库 管 理 系 


数据 独立 性 是 什么 意思 ? 


统 的 作用 是 什么 ? 


4. 模式 和 子 模式 有 什么 不 同 ? 


[= 


< 


Oo 


0 


. 指出 把 应 用 软件 与 数据 库 管 理 系 统 分 离 的 两 


个 好 处 。 


. 描述 抽象 数据 类 型 〈 见 第 8 章 ) 与 数据 库 模 型 


的 相似 之 处 。 


. 说 出 下 列 情况 或 活动 在 数据 库 系 统 (用 户 、 应 


用 软件 程序 员 、 数 据 库 管 理 系统 软件 的 设计 
者 ) 中 发 生 的 级 别 : 

数据 在 磁盘 上 怎样 存储 效率 才 最 高 ? 
b，243 航 班 还 有 空位 吗 ? 

c. 在 海量 存储 器 中 ， 关 系 应 当 如 何 组 织 ? 

d. 允许 用 户 斋 错 几 次 口令 才 终 止 对 话 ? 

e. 怎样 才能 实现 PROJECT 运 算 ? 


从 


. 下 列 哪 一 项 工作 是 由 数据 库 管理 系统 完成 的 ? 


a. 确保 将 用 户 对 数据 库 的 访问 权限 制 在 相应 
的 子 模式 内 。 

b. 把 基于 数据 库 模型 的 一 些 命令 翻译 成 对 实 
际 数据 存储 系统 的 活动 。 

c. 隐藏 数据 库 中 的 数据 分 散在 网 络 中 的 许多 
计算 机 内 的 这 一 事实 。 


. 在 一 个 关系 数据 库 中 ， 怎 样 表示 以 下 有 关 


航空 公司 、 航 班 〈 对 某 一 天 而 言 ) 和 乘客 
的 信息 。 

航空 公司 : Clear Sky、Long Hop、Tree Top 
Clear Sky 的 航班 : CS205、CS37、CS102 
Long Hop 的 航班 : LH67、LH89 


. 给 出 一 个 论据 ， 


Tree Top 的 航班 :TT331、TT809 
Smith 已 预订 CS205 (12B 座 ) 、CS37 (18C 座 ) 
和 LH89 (14A 座 )。 

Baker 己 预订 CS37 (18B 座 ) 和 LH89 (14B 座 )。 
Clark 已 预订 LH67 (5A 座 ) 和 TT331 (4B 座 )。 
从 何 种 程度 上 讲 ， 对 一 个 关系 应 用 SELECT 和 
PROJECT 运 算 的 次 序 是 有 意义 的 ? 或 者 说 ， 在 
怎样 的 条 件 下 , 先 做 SELECT 运算 再 做 PROJECT 
运算 的 结果 , 与 先 做 PROJECT 运 算 再 做 SELECT 
运算 的 结果 一 样 ? 

证 明 9.2 节 描述 的 JOIN 运 算 中 
的 where 子 句 是 不 必要 的 。( 也 就 是 说 ， 要 证 
明 任何 用 到 where 子 句 的 查询 语句 都 能 够 通 
过 下 面 这 样 的 方式 重新 表示 : 用 JOIN 运算 把 
一 个 关系 中 的 每 一 个 元 组 与 另 一 个 关系 中 的 
每 一 个 元 组 连接 起 来 。) 


. 对 下 列 关系 ， 执 行 以 下 各 指令 后 ， 关 系 RESULT 


是 怎样 的 : 
X 关 系 Y 关系 
U V WwW R Ss 
A | z J 
B | D K 
€ | 


a. RESULT <— PROJECT W from X 

b. RESULT <— SELECT from X where W= 5 

€. RESULT < 一 PROYJECT S from Y 

d. RESULT < 二 JOIN X and Y where X.W 宇 
Y 区 


. 根据 以 下 数据 库 ， 利 用 SELECT、PROJECT 


和 JOIN 命令 ， 写 出 指令 序列 来 回答 下 列 有 关 
部 件 与 生产 商 的 问题 。 
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20. 


2 


2 


PART 关系 
PartName Weight 
Bolt 2X 1 
Bolt 2Z ‘9 
Nut V5 0.5 
MANUFACTURER 关系 
CompanyName PartName Cost 


Company X 
Company X 
Company Y 


Bolt 2Z 
Nut V5 
Bolt 2X 
Nut V5 
Bolt 2Z 
Nut V5 


Company Y 
Company Y 
Company Z 





a. 哪些 公司 生产 了 Bolt 2Z? 

b. 获取 Company X 生 产 的 部 件 的 列表 以 及 每 
个 部 件 成 本 (cost) 的 列表 。 

c. 哪些 公司 生产 重量 为 1 的 部 件 ? 


. 用 SQL 回答 第 13 题 。 
15. 


利用 SELECT、PROJECT 和 JOIN 命令 ， 写 出 指 

令 序列 来 回答 以 下 几 个 有 关 图 9%-5 中 的 

EMPLOYEE、JOB 和 ASSIGNMENT 关 系 中 信息 的 

问题 : 

a. 获取 公司 员工 姓名 和 地 址 列表 。 

b. 获取 在 人 事 部 工作 和 曾经 工作 过 的 人 员 姓 
名 和 地 址 列表 。 

c. 获取 正在 人 事 部 工作 的 人 员 姓 名 和 地 址 
列表 。 


. 用 SQL 回答 上 题 。 
. 设计 一 个 包含 作曲 家 、 生 平 及 其 作品 信息 的 关 


系数 据 库 。《〈 避 免 类 似 于 图 9-4 中 的 元 余 。) 


. 设计 一 个 包含 乐队 、 唱 片 以 及 所 录 乐 曲 的 作曲 


者 信息 的 关系 数据 库 。 
的 元 余 。 ) 


(避免 类 似 于 图 9-4 中 


. 设计 一 个 包含 计算 设备 生产 商 及 其 产品 的 关 


系数 据 库 。【〈 避 免 类 似 于 图 9-4 中 的 元 余 。) 
设计 一 个 包含 有 关 出 版 商 \、 杂 志 及 订户 信息 的 
关系 数据 库 。 (避免 类 似 于 图 9-4 中 的 见 余 。) 
设计 一 个 包含 有 关 零 部 件 、 供 应 商 及 客户 信息 
的 关系 数据 库 。 每 种 零 部 件 可 有 几 个 供应 商 供 
应 , 并 可 有 多 个 客户 订购 。 每 个 供应 商 可 以 供 
应 许多 种 零 部 件 , 也 可 有 多 个 客户 。 每 个 客户 
可 以 向 多 个 供应 商 订购 多 种 零 部 件 ， 实 际 上 ， 
同一 种 零 部 件 可 向 一 个 以 上 的 供应 商 订 购 。 
(避免 类 似 于 图 9-4 中 的 元 余 。) 

写 出 一 个 指令 序列 (利用 SELECT、PROJECT 
及 JOIN 运 算 ) ， 检 索 图 9-5 所 述 的 关系 数据 库 


23; 
24. 


25. 
26. 


2 
28. 


29. 


30. 


3 


32. 
33， 


中 财务 部 每 个 职务 的 gobId、StartDate 及 
TermDate。 

用 SQL 回答 上 题 。 

写 出 一 个 指令 序列 (利用 SELECT、PROJECT 
及 JOIN 运算 ) ， 检 索 图 9-5 所 述 的 关系 数据 库 
中 现任 每 位 员工 的 Name 、Address 、 
JobTitle 及 Dept。 

用 SQL 回答 上 题 。 

写 出 一 个 指令 序列 (利用 SELECT、PROJECT 
及 JOIN 运算 ) ， 检 索 图 9-5 所 述 的 关系 数据 库 
中 现任 每 个 员工 的 Name 及 JobTit1le。 


用 SQL 回答 上 题 。 
由 单一 关系 
Name Department “ TelephoneNumber 
Jones Sales 555-2222 
Smith Sales 555-3333 
Baker Personnel 555-4444 
和 两 个 关系 
Name Department 
Jones Sales 
Smith Sales 
Baker Personnel 
Department “ TelephoneNumber 
Sales 555-2222 
Sales 555-3333 
Personnel 555-4444 
提供 的 信息 有 什么 不 同 ? 
设计 一 个 包含 汽车 部 件 及 其 子 部 件 的 关系 数 


据 库 。 要 做 到 : 一 个 部 件 可 以 包含 更 小 的 零件 ， 
同时 它 本 身 可 以 是 更 大 部 件 的 零件 。 
选择 一 个 常用 的 网 站 ， 像 www.google.com、 
Www.amazon.com 或 www.ebay.com， 设 计 一 个 
关系 数据 库 ， 作 为 网 站 的 支持 数据 库 。 
基于 图 9-5 所 示 的 数据 库 ， 说 明 以 下 程序 段 回 
答 的 问题 : 
TEMP ~ SELECT from ASSIGNMENT 

Where TermDate = '*' 


RESULT «~ PROJECT JobId, StartDate 
from TEMP 


把 上 题 中 的 查询 翻译 成 SQL 语句 。 
基于 图 9-5 所 示 的 数据 库 ， 说 明 以 下 程序 段 回 
答 的 问题 : 


TEMP1 «~ JOIN EMPLOYEE and ASSIGNMENT 
Where EMPLOYEE.EmplId = 
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34. 
35. 


un 


3 
3 


38. 


3 


Ro 


4 


*4 


一 


*42 


*43 


2 


S 


第 9 章 数据库 系 统 
ASSIGNMENT .EmplId 
TEMP2 «~ SELECT from TEMP1 where 
TermDate = !*) 
RESULT «~ PROJECT Name, StartDate 
from TEMP2 


把 上 题 中 的 查询 翻译 成 SQL 语句 。 

基于 图 9-5 所 示 的 数据 库 ， 说 明 以 下 程序 段 回 

答 的 问题 ; 

TEMP1 «~ JOIN EMPLOYEE and JOB where 
EMPLOYEE，EmplId = JOB.EmplId 

TEMP2 ~ SELECT from TEMP1 where Dept = 
"SALES 


RESULT «- PROUECT Name from TEMP2 


把 上 题 中 的 查询 翻译 成 SQL 语句 。 

把 下 面 的 SQL 语句 翻译 成 SELECT、PROJECT 

及 JOIN 运算 的 序列 。 

SELECT Job .JobTitle 

FROM Assignment, Job 

WHERE Assignment.JoblId = 
AND Assignment.EmplId = 


Job .JobId 
'34Y70" 


把 下 面 的 SQL 语 句 翻译 成 SELECT、PROJECT 
及 JOIN 运算 的 序列 。 


SELECT Assignment.StartDate 

FROM Assignment, Employee 

WHERE Assignment.EmplId = 
Employee.EmplId 
AND Employee.Name = 'Joe E. Baker， 


. 说 明 对 第 13 题 中 数据 库 执 行 以 下 SQL 语句 后 


的 效果 。 


INSERT INTO Manufacturer 
VALUES ('Company 2','Bolt 2X',.03) 


说 明 对 第 13 题 中 数据 库 实 施 以 下 SQL 语句 后 
的 效果 : 
UPDATE Manufacturer 
SET Cost = .03 
WHERE CompanyName = 'Company Y' 
AND PartName = 'Bolt 2X' 


. 请 确定 用 来 维护 杂货 店 库存 的 面向 对 象 数 据 
库 中 的 几 个 对 象 ， 并 说 明 每 个 对 象 中 应 该 包含 
哪些 方法 ? 

. 请 确定 用 来 维护 图 书馆 藏书 记录 的 面向 对 象 
数据 库 中 的 几 个 对 象 ， 并 说 明 每 个 对 象 中 应 该 
包含 哪些 方法 ? 

. 如 果 T1 和 T2 两 个 事务 按 如 下 安排 来 调度 ， 会 


*44. 


*4 


un 


*46. 


wy 


*4 


Oo 


*4 


*50. 


3 


一 


2352; 


We 


LULD 


上 


人 


ba 


产生 什么 样 的 错误 信息 ? 

Tl 设计 为 计算 账户 A 和 B 的 总 和 , T2 设 计 为 
从 账户 A 转账 100 美 元 到 账户 B。TI1 先 检索 
账户 A 的 余额 ， 然 后 T2 执 行 转账 ， 最 后 T1 
检索 账户 B 的 余额 , 并 输出 检索 到 的 两 个 值 
的 总 和 。 

说 明 怎 样 用 文中 介绍 的 锁定 协议 来 解决 问 
题 43 中 产生 的 错误 。 


. 第 43 题 中 如 果 T1 是 较 新 的 事务 ， 那 么 受伤 等 


待 协议 会 对 上 述 事 件 序列 起 什么 作用 ? 如 果 
T2 是 较 新 的 事务 ， 结 果 又 如 何 ? 

假设 有 一 个 事务 试图 在 一 个 余额 为 200 美 元 的 
账户 中 存 入 100 美 元 ， 同 时 另 一 事务 试图 从 同 
一 账户 取出 100 美 元 。 描 述 如 何 通过 这 些 事务 
的 交叉 处 理 ， 使 得 最 后 余额 变 为 100 美 元 。 描 
述 如 何 通过 这 些 事务 的 交叉 处 理 , 使 得 最 后 余 
额 变 为 300 美 元 。 

一 个 事务 对 数据 库 中 的 一 个 数据 项 ， 有 互 斥 访 
问 和 有 共享 访问 有 什么 不 同 ? 为 什么 这 种 差 
别 很 重要 ? 


. 9.4 节 讨论 过 的 关于 并 发 事务 的 一 些 问题 不 仅 


限于 数据 库 环境 。 当 用 文字 处 理 程序 来 访问 同 
一 个 文档 时 会 产生 怎样 类 似 的 问题 ?( 如果 你 
的 PC 中 有 字 处 理 程序 ， 试 着 激活 两 个 实例 来 
访问 同一 文档 ， 看 看 会 发 生 什 么 。) 

假定 一 个 顺序 文件 有 50 000 条 记录 , 查询 一 条 
记录 需要 5 ms。 请问; 检索 一 条 处 在 文件 中 间 
部 位 的 记录 ， 需 要 等 待 多 长 时 间 ? 

见 图 9-15 中 的 归并 算法 , 如 果 其 中 一 个 输入 文件 
一 开始 就 是 空 的 ， 请 列 出 执行 该 算法 的 步骤 。 


. 修改 图 9-15 中 的 算法 ， 来 处 理 这 样 一 种 情况 : 


两 个 输入 文件 都 包含 一 个 有 同样 键 字段 值 的 
记录 。 假定 这 些 记录 都 一 样 , 在 输出 文件 里 只 
要 有 一 个 即 可 。 
设计 一 个 系统 , 利用 这 个 系统 ,存储 在 磁盘 上 
的 一 个 文件 能 够 作为 顺序 文件 以 两 种 不 同 的 
顺序 进行 处 理 。 


. 说 明 如 何 能 够 利用 一 个 文本 文件 作为 基本 结构 ， 


来 构建 一 个 包含 杂志 订阅 者 信息 的 顺序 文件 。 


. 设计 一 种 技术 , 通过 这 种 技术 , 将 逻辑 记录 大 


小 并 不 一 致 的 顺序 文件 作为 文本 文件 来 实现 。 
例如 ， 假 设 要 构建 一 个 包含 小 说 家 信息 的 顺序 
文件 , 其 每 条 逻辑 记录 都 包含 一 个 作家 的 信息 
及 其 作品 列表 。 

索引 文件 与 散 列 文 件 相 比 ， 有 什么 优势 ? 散 列 
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文件 与 索引 文件 相 比 ， 又 有 什么 优势 ? 当 把 键 翻译 为 一 个 二 进 制 值 时, 应 当 搜寻 哪个 
*56. 本 章 描述 了 传统 文件 索引 与 由 操作 系统 维护 区 来 寻找 其 键 值 为 整数 124 的 记录 ? 

的 文件 目录 系统 之 间 的 相似 之 处 。 在 哪些 方面 *60. 通过 比较 散 列 文件 的 实现 与 同 构 二 维 数组 的 

操作 系统 的 文件 目录 与 传统 索引 不 同 ? 实现 , 说 明 散 列 函数 与 地 址 多 项 式 的 作用 有 什 
*57. 如 果 将 散 列 文件 分 到 10 个 桶 里 ， 那 么 任意 3 条 么 类 似 之 处 ? 

记录 中 的 至 少 2 条 放 进 同一 个 桶 的 概率 是 多 *61. 试 给 出 下 列 比较 中 的 一 个 优点 : 

少 ? (假定 散 列 函数 不 让 任何 一 个 桶 拥有 优先 a. 顺序 文件 优 于 索引 文件 。 

权 。) 文件 中 必须 存放 有 和 多少 条 记录 , 才 可 能 b. 顺序 文件 优 于 散 列 文件 。 

发 生 磁 撞 ? c. 索引 文件 优 于 顺序 文件 。 
*58. 假设 将 文件 分 进 100 个 桶 而 不 是 10 个 桶 ， 重 解 d. 索引 文件 优 于 散 列 文件 。 

上 题 。 e. 散 列 文件 优 于 顺序 文件 。 


*59. 如 果 我 们 利用 本 章 讨论 过 的 除法 技术 作为 散 


La 


散 列 文件 优 于 索引 文件 。 


列 函数 , 并 且 将 文件 存储 区 分 成 23 个 桶 ,那么 *62. 从 哪个 方面 可 以 看 出 顺序 文件 类 似 于 链表 ? 
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希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 。 回 答 出 这 
些 问题 还 不 够 ,还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 


l, 


iD 


LD 


在 美国 ， 所 有 联邦 办 犯 的 DNA 记 录 都 存储 在 一 个 数据 库 中 ， 供 刑事 侦察 使 用 。 如 果 发 布 
这 些 信息 用 于 其 他 用 途 ， 如 用 作 医 学 研究 ， 这 样 做 道德 吗 ? 如 果 合 乎 道德 ， 可 用 于 什么 
目的 ? 如 果 不 合乎 道德 ， 为 什么 ? 而 每 种 情况 的 利 与 浆 又 是 什么 ? 


. 大 学 能 将 其 学 生 的 信息 公开 到 何 种 程度 ? 可 以 公布 他 们 的 姓名 和 地 址 吗 ? 可 以 在 学 生 不 


知情 的 情况 下 公布 他 们 的 成 绩 排 名 吗 ? 你 的 看 法 是 否 与 第 1 题 的 答案 一 致 ? 


. 构建 有 关 个 人 的 数据 库 时 ， 采 取 什 么 样 的 限制 比较 合适 ? 政府 有 权 掌 握 公 民 的 什么 信 


息 ? 保险 公司 有 权 掌 握 其 客户 的 什么 信息 ? 公司 有 权 掌 握 其 雇员 的 什么 信息 ? 在 这 些 
情况 中 ， 需 要 实行 控制 吗 ? 如 果 需 要 ， 怎 样 实现 ? 


. 如 果 信 用 卡 公司 把 它 的 客户 的 消费 模式 卖 给 商业 公司 ， 这 样 做 是 否 合适 ?如果 赛 车 邮购 


业务 公司 把 它 的 邮购 列表 卖 给 赛车 杂志 ， 这 样 做 是 否 合适 ? 如 果 美 国 国税 局 把 那些 有 着 
巨额 收入 的 纳税 人 的 姓名 和 地 址 信息 卖 给 股票 经 纪 人 ， 这 样 做 是 否 合适 ? 如 果 你 没有 充 
分 的 把 握 回 答 是 与 否 ， 那 么 你 有 什么 可 行 的 方案 ? 


. 数据 库 的 设计 者 对 于 如 何 使 用 数据 库 信息 应 当 负 怎样 的 责任 ? 
. 假设 数据 库 的 信息 因数 据 库 错误 而 被 未 经 同意 的 用 户 访问 。 如 果 信 息 被 不 当 获 得 和 使 


用 ,那么 数据 库 设 计 者 应 对 此 承担 何 种 责任 ? 你 的 回答 是 否 与 作恶 者 为 发 现 数据 库 设 计 
漏洞 并 获取 未 授权 信息 所 花费 的 精力 大 小 有 关 ? 


. 数据 挖掘 的 盛行 带 来 了 大 量 的 道德 和 隐私 问题 。 如 果 数 据 挖掘 揭示 了 你 所 在 社区 的 所 有 


居民 的 某 些 特性 ， 那 么 你 的 隐私 是 否 受到 侵犯 ? 数据 挖掘 的 使 用 是 促进 了 商业 的 发 展 还 
是 鼓励 了 盲从 ? 因为 相对 于 个 别 问 卷 调查 明确 询问 的 方式 而 言 ， 从 人 口 普 查 的 数据 中 能 
提取 更 多 的 信息 ， 那 么 强制 公民 参加 人 口 普查 是 否 合适 呢 ? 数据 挖掘 给 予 商业 公司 的 好 
处 ， 对 于 不 知情 的 客户 来 说 是 否 不 公平 ? 这 样 一 种 状况 的 好 与 坏 ， 到 了 何 种 程度 ? 


. 对 于 个 人 或 公司 收集 和 保留 私人 信息 ， 能 允许 到 多 大 的 程度 ? 尽管 收集 的 信息 分 散在 一 


些 发 起 者 之 间 ， 但 是 如 果 这 些 信息 已 经 能 公开 地 获得 ， 那 么 现在 该 怎么 办 ? 个 人 或 公司 
期 望 在 何 种 程度 上 保护 这 类 信息 ? 
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9. 许多 图 书馆 提供 参考 查询 服务 ， 所 以 读者 在 查阅 信息 时 可 以 得 到 图 书 管理 员 的 帮助 。 因 特 
网 和 数据 库 技术 的 出 现 是 否 会 使 这 种 服务 过 时 ? 如 果 会 ， 那么 这 是 前 进 了 还 是 倒退 了 ? 
如 果 不 会 ， 为 什么 ? 因特网 和 数据 库 技术 的 存在 对 图 书 管理 员 本 身 有 什么 样 的 影响 ? 

10. 你 的 身份 信息 被 盗用 的 可 能 性 到 了 什么 程度 ?你 会 采取 哪些 步骤 使 次 用 机 会 最 小 ?如 

果 你 的 个 人 信息 被 窃 ， 对 你 的 伤害 将 有 多 大 ? 如 果 发 生 这 种 情况 ， 你 自己 有 责任 吗 ? 
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章 将 探索 计算 机 图 形 学 领域 ， 这 是 一 个 对 电影 和 交互 式 视频 游戏 的 制作 具有 重大 影 
响 的 领域 。 实 际 上 ， 计 算 机 图 形 学 的 发 展 解除 了 视觉 媒体 对 实体 的 限制 ， 许 多 人 认 
为 计算 机 动画 在 不 和 久 的 将 来 会 取代 整个 影视 产业 对 传统 的 演员 、 布 景 和 照片 的 需求 。 


本 章 内 容 

10.1 计算 机 图 形 学 的 范围 1 

10.2 3D 图 形 概述 *10.5 ”处理 全 局 照明 ， 

10.3” 建 模 1061 动画 

计算 机 图 形 学 是 计算 机 科学 的 分 支 ， 它 应 用 计算 机 技术 创建 和 操控 视觉 表现 。 这 是 一 个 广 
泛 的 主题 ， 它 包括 : 文本 表示 、 图 形 和 图 表 的 创建 、 图 形 化 用 户 界面 的 开发 、 照 片 的 操作 、 视 
频 游戏 的 制作 、 动 画 电 影 的 生成 等 。 然 而 ， 术 语 计算 机 图 形 学 越 来 越 多 地 被 用 来 指 代 3D 图 形 学 


的 特定 领域 ， 本 章 大 部 分 内 容 将 集中 在 这 个 主题 上 。 我 们 将 从 定义 3D 图 形 学 开始 ， 痢 明 它 在 较 
广义 的 计算 机 图 形 学 中 的 作用 。 


err tte Ee ee oe EE eee ee PAE PMT 


10.1 计算 机 图 形 学 的 范围 


随 着 数码 相机 的 出 现 ， 数 字 编 码 图 像 处 理 软件 迅速 流行 起 来 。 人 们 可 以 使 用 这 类 软件 通过 
去 除 污 点 和 “红眼 ”等 操作 达到 “润色 ”照片 的 目的 ， 也 可 以 在 不 同 的 照片 中 进行 裁剪 和 粘贴 ， 
创建 并 非 反 映 真实 世界 的 图 像 。 

类 似 的 技术 经 常 被 影视 产业 用 来 制造 特效 。 事 实 上 ， 这 些 应 用 是 影视 产业 从 模拟 系统 (如 
胶卷 ) 转向 数字 编码 图 像 的 主要 推动 因素 。 这 类 应 用 可 用 于 改变 最 初 拍 摄 的 情节 ， 如 去 除 支 撑 
的 金属 丝 、 闭 加 多 个 图 像 ， 或 产生 新 的 图 像 序列 帧 等 。 

除了 处 理 数 字 照 片 和 运动 图 像 帧 的 软件 外 ， 现 在 还 有 各 种 各 样 的 工具 /应 用 软件 包 ， 可 帮助 
产生 二 维 图 像 ， 从 简单 的 画 线 到 复杂 的 艺术 品 。( 一 个 众所周知 的 最 基本 的 例子 就 是 微软 的 “ 画 
图 ”应 用 程序 。) 这 类 程序 的 基本 操作 包括 : 绘制 点 和 线 、 插入 椭圆 和 算 形 这 类 简单 的 儿 何 图 形 、 
给 区 域 填 充 颜色 ， 以 及 裁剪 和 粘贴 图 画 的 指定 部 分 。 

注意 ， 上 面 所 有 的 应 用 都 是 用 于 处 理 平 面 二 维 图 形 和 图 像 的 。 因 此 ， 这 里 有 两 个 相关 的 研究 
领域 : 一 个 是 2D 图 形 学 (2D graphics); 另 一 个 是 图 像 处 理 〈image processing)。 二 者 的 区 别 在 于 : 
2D 图 形 学 侧重 于 把 二 维 图 形 ( 圆 、 和 矩形 、 文 字 等 ) 转化 为 像素 模式 ， 产 生 图 像 ， 而 图 像 处 理 〈 本 
书后 面 研究 人 工 智能 时 会 介绍 它 ) 侧重 于 分 析 图 像 中 的 像素 ， 进 行 模式 识别 ， 以 达到 增强 或 “ 理 
解 ” 图 像 的 目的 。 简 言 之 ，2D 图 形 学 是 用 来 生成 图 像 的 ， 而 图 像 处 理 是 用 来 分 析 图 像 的 。 

与 2D 图 形 学 中 把 二 维 图 形 转 化 为 图 像 相 对 应 ，3D 图 形 学 〈3D graphics) 领域 是 把 三 维 图 形 
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转化 成 图 像 。 这 个 过 程 是 : 建造 三 维 场景 的 数字 编码 版 本 ， 然 后 模拟 照相 的 过 程 ， 产 生 这 些 场 
景 的 图 像 。 这 与 传统 的 摄影 类 似 ， 不 同 之 处 在 于 场景 是 使 用 3D 图 形 技术 “拍摄 ”出 来 的 ， 实 际 
是 不 存在 的 ， 存 在 的 是 数据 和 算法 的 集合 。 因 此 ，3D 图 形 “ 拍 摄 ”的 是 虚拟 世界 ， 而 传统 的 摄 
影 技术 拍摄 的 是 真实 世界 。 

重要 的 是 要 注意 ， 使 用 3D 图 形 创建 图 像 要 经 历 两 个 不 同 的 步骤 : 一 个 是 创建 、 编 码 、 存 储 
以 及 操作 被 拍摄 出 来 的 场景 ， 另 一 个 是 生成 图 像 的 过 程 。 前 者 是 创造 性 的 、 艺 术 的 过 程 ， 而 后 
者 则 是 以 计算 为 主 的 过 程 。 这 些 主题 是 我 们 在 下 面 4 节 中 将 要 讨论 的 。 

3D 图 形 可 以 制作 出 不 依赖 于 实体 的 虚拟 场景 的 “照片 >， 这 使 得 它 非 常 适 用 于 交互 式 
视频 游戏 和 动画 电影 的 制作 。 交 互 式 视频 游戏 由 编码 的 三 维 虚拟 环境 构成 ， 游 戏 玩 家 与 之 
进行 交互 ， 玩 家 看 到 的 图 像 是 通过 3D 图 形 技术 制作 出 来 的 。 动 画 电影 是 用 类 似 的 方法 创建 
的 ， 不 同 之 处 在 于 只 是 动画 制作 者 与 虚拟 环境 交互 ， 而 公众 看 到 的 则 是 导演 / 制 片 人 发 布 
的 二 维 图 像 帧 序列 。 

本 书 将 在 10.6 节 中 更 全 面 地 讨论 3D 图 形 学 在 动画 中 的 应 用 。 这 里 可 以 想象 一 下 ， 随 着 3D 图 
形 技术 的 发 展 ， 这 些 应 用 将 可 能 导向 何 处 。 如 今 ， 电 影 是 作为 二 维 图 像 序 列 发 布 的 。 尽 管 显示 
这 些 信息 的 放映 机 已 经 取得 了 很 大 的 进步 ， 从 使 用 胶卷 的 模拟 设备 到 使 用 DVD 播放 机 和 平板 显 
示 器 的 数字 技术 ， 但 它们 的 显示 仍然 只 是 二 维 的 。 

但 是 ,想象 一 下 当 创建 和 操作 真实 的 三 维 虚拟 世界 的 能 力 得 到 改善 时 , 将 会 发 生 什么 改变 。 
我 们 将 不 再 仅 能 “拍摄 ”这 些 虚 拟 世界 和 以 二 维 图 像 的 形式 发 布 电影 ， 而 且 能 发 布 虚拟 世界 。 
观看 者 将 不 仅仅 能 观看 电影 ， 还 可 以 “亲临 ”其 境 。 通 过 “3D 图 形 放 映 机 ”来 观看 虚拟 场景 ， 
就 像 通过 专用 的 “游戏 盒 ” 来 观看 视频 游戏 一 样 。 观 众 可 能 先 看 到 导演 / 制 片 人 预定 的 “推荐 情 
节 ” 与 此 同时 还 可 以 与 虚拟 场景 交互 ， 就 像 玩 视 频 游戏 一 样 产生 另外 的 场景 。 考 虑 到 正在 研发 
的 三 维 人 机 接口 的 潜力 ， 未 来 的 前 景 十 分 诱 人 。 


问题 与 练习 

1. 总 结 图 像 处 理 、2D 图 形 学 和 3D 图 形 学 它们 两 两 之 间 的 区 别 。 
2. 3D 图 形 学 与 传统 摄影 有 何不 同 ? 

3. 应 用 3D 图 形 学 制作 “照片 ”的 两 个 主要 步骤 是 什么 ? 


10.2 ”3D 图 形 概述 


本 章 我 们 从 创建 和 显示 图 像 的 整个 过 程 来 开始 对 3D 图 形 学 的 研究 ， 这 个 过 程 由 3 步 构成 : 
建 模 、 泻 染 (rendering) 和 显示 。 建 模 步 又 (将 在 10.3 节 中 详细 介绍 ) 与 传统 电影 产业 中 设计 和 
构造 一 个 场景 类 似 ， 不 同 之 处 在 于 3D 图 形 场景 是 用 数字 编码 数据 和 算法 “构造 ”的 。 这 就 导致 
计算 机 图 形 学 所 产生 的 场景 可 能 在 现实 中 永远 都 不 存在 。 

下 一 步 就 是 通过 计算 场景 中 的 物体 如 何 显示 在 由 特定 位 置 的 相机 拍摄 的 照片 中 ， 来 生成 场 
景 的 二 维 图 像 。 这 个 步骤 称 为 泻 染 (rendering)， 是 10.4 节 和 10.5 节 的 主题 。 泻 染 的 概念 是 运用 
解析 几何 ， 来 计算 场景 中 的 物体 到 一 个 称 为 投影 平面 (projection plane) 的 面 上 会 形成 的 投影 ， 
这 种 方式 与 相机 将 场景 投影 到 胶卷 上 的 方式 类 似 〈 见 图 10-1)。 这 种 投影 称 为 透视 投影 
(perspective projection)， 在 这 种 投影 方式 下 ， 所 有 的 目标 都 沿 着 一 条 称 为 投影 线 (projector) 的 
直线 向 前 延伸 ， 这 条 直线 是 从 一 个 称 为 投影 中 心 (center of projection ) 或 视点 (view point) 的 
公共 点 延伸 出 来 的 。[ 这 与 平行 投影 (parallel projection) 不 同 ， 顾 名 思 义 ， 平 行 投影 线 是 平行 
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的 。 透 视 投 影 产 生 的 投影 类 似 于 人 类 眼睛 所 看 到 的 ， 而 平行 投影 产生 的 是 物体 “真正 ”的 剖面 ， 
这 在 工程 绘图 中 非常 有 用 。] 







图 像 窗口 
场景 中 的 物体 


物体 在 投影 平 
面 上 的 图 像 
投影 中 心 


图 10-1 ”3D 图 形 学 范例 


对 于 用 来 定义 最 终 图 像 边界 的 投影 平面 ， 其 中 受 限 的 部 分 称 为 图 像 窗口 (image window)。 它 
对 应 于 显示 在 大 多 数 相 机 取景 器 上 的 矩形 ， 指 明 潜 在 图 像 的 边界 。 实 际 上 ， 大 多 数 相机 的 取景 器 允 
许 用 户 看 到 相机 投影 平面 上 更 大 的 区 域 ， 而 不 仅仅 是 图 像 窗 口 。( 你 可 能 会 在 取景 器 中 看 到 玛 莎 阿 
姨 头 部 的 上 方 ， 但 是 ， 除 非 这 部 分 影像 也 出 现在 图 像 窗 口中 ， 否 则 它 就 不 会 出 现在 最 终 图 像 中 。) 

一 旦 确定 了 投影 到 图 像 窗口 的 场景 部 分 ， 就 可 以 计算 出 最 终 图 像 上 的 每 个 像素 点 的 显示 情 
况 , 这 种 逐个 像素 的 计算 过 程 可 能 会 很 复杂 , 因为 它 需 要 确定 场景 中 的 物体 如 何 与 光线 融合 (在 
明亮 光线 下 硬 且 有 光泽 的 表面 与 在 间接 光线 下 软 且 透 明 的 表面 ， 二 者 的 演 染 方法 应 该 有 所 不 
同 )。 因 此 ， 泻 染 处 理 涉及 包括 材料 科学 和 物理 学 在 内 的 许多 其 他 研究 领域 。 而 且 ， 在 决定 一 个 
物体 的 显示 效果 时 经 常 需要 了 解 场景 中 的 其 他 物体 。 这 个 物体 可 能 处 在 另 一 个 物体 的 阴影 中 ， 
或 者 这 个 物体 是 镜子 ， 它 的 外 观 实质 上 就 是 另 一 个 物体 。 

当 确定 了 每 个 像素 的 外 观 后 ， 结 果 被 表示 成 图 像 的 位 图 ， 集 中 存储 在 称 为 帧 缓冲 区 〈frame 
buffer) 的 存储 区 域 中 。 这 个 缓冲 区 可 能 是 主 存 中 的 一 个 区 域 , 或 当 有 专门 处 理 图 形 应 用 的 硬件 
时 ， 它 可 能 是 专用 存储 电路 中 的 一 个 块 。 

最 后 ， 存 储 在 帧 绥 冲 区 的 图 像 或 者 为 了 观看 而 显示 ， 或 者 为 以 后 的 显示 而 传送 给 更 永久 的 
存储 器 。 如 果 生 成 的 图 像 是 用 于 电影 的 ， 那 么 在 最 终 显示 前 它 可 能 会 被 存储 甚至 修改 。 但 是 ， 
在 交互 式 视频 游戏 或 飞行 模拟 器 中 ， 图 像 必须 显示 ， 因 为 它们 是 在 实时 生成 的 ， 这 个 要 求 经 常 
限制 了 图 像 的 质量 。 这 就 是 由 制 片 广发 布 的 功能 齐全 的 动画 产品 的 图 像 质量 要 超过 当今 交互 式 
视频 游戏 中 的 图 像 质量 的 原因 。 

我 们 通过 分 析 一 个 典型 的 视频 游戏 系统 来 结束 对 3D 图 形 的 介绍 。 这 个 游戏 实际 上 就 是 一 个 
编码 的 虚拟 世界 和 软件 的 结合 体 ， 它 允许 游戏 玩家 操控 这 个 虚拟 世界 。 当 玩家 操控 这 个 世界 时 ， 
游戏 系统 会 不 断 地 泻 染 场 景 并 把 图 像 存储 到 图 像 缓冲 区 中 。 为 了 克服 真实 世界 的 时 间 限 制 ， 大 多 
数 演 染 处 理 都 是 由 专用 硬件 来 实现 的 。 实 际 上 ， 正 是 这 些 硬件 使 游戏 系统 和 一 般 个 人 计算 机 之 间 有 
了 显 车 差别 。 最 后 ， 游 戏 系统 中 的 显示 设备 显示 了 帧 缓冲 区 中 的 内 容 ， 给 玩家 以 变化 场景 的 约 觉 。 


问题 与 练习 


1. 总 结 在 使 用 3D 图 形 生 成 图 像 时 涉及 的 3 个 步骤 。 
2. 投影 平面 和 图 像 窗 口 之 间 有 何不 同 ? 
3. 什么 是 帧 缓冲 区 ? 
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10.3 建 模 


3D 计 算 机 图 形 投影 的 起 始 阶段 与 戏剧 舞台 制作 方式 十 分 相似 : 必须 设计 出 布景 ， 收 集 或 者 
搭建 所 需 的 道具 。 在 计算 机 图 形 学 的 术语 中 ， 布 景 称 为 场景 (scene)， 道 具 称 为 物体 〈object)。 
记 住 ，3D 图 形 场景 是 虚拟 的 ， 因 为 组 成 它 的 物体 是 由 数字 编码 模型 “构建 ”而 成 ， 并 不 是 实际 
的 物理 结构 。 

本 节 将 探讨 与 “构建 ”物体 和 场景 有 关 的 话题 。 我 们 以 单个 物体 的 建 模 问 题 开 始 ， 并 以 考 
虑 收集 这 些 物体 以 形成 场景 这 个 任务 结束 。 


10.3.1 单个 物体 的 建 模 


在 舞台 制作 中 ， 道 具 的 真实 程度 取决 于 它 在 场景 中 的 使 用 方式 。 我 们 可 能 不 需要 一 辆 完整 
的 汽车 ， 电 话 并 不 需要 能 用 ， 背 景 可 能 也 只 是 画 在 大 背景 屏幕 上 的 。 同 样 ， 就 计算 机 图 形 学 而 
言 ， 一 个 物体 的 软件 模型 能 准确 地 反映 物体 真实 属性 的 程度 依赖 于 情境 的 需要 。 前 景物 体 的 建 
模 与 背景 中 的 物体 相 比 需要 考虑 更 多 的 细节 。 而 且 ， 在 那些 没有 严格 实时 限制 的 情况 下 ， 会 产 
生 更 多 的 细节 。 

因此 ， 一 些 物体 模型 可 能 相对 简单 ， 而 另 一 些 可 能 极其 复杂 。 作 为 一 个 通用 规则 ， 模 型 越 
精确 ， 图 像 的 质量 越 高 ， 但 泻 染 所 需要 的 时 间 也 就 越 长 。 因 此 ， 现 在 进行 的 大 多 数 对 于 计算 机 
图 形 学 的 研究 都 是 在 寻求 开发 技术 ， 以 构建 非常 精细 ， 同 时 又 不 失 高 效 的 物体 模型 。 这 些 研究 
中 有 些 涉及 开发 模型 ， 开 发 模型 依据 物体 在 场景 中 的 最 终 作 用 来 提供 不 同 的 细节 层次 ， 这 样 可 
以 在 变化 的 场景 中 重用 同一 个 物体 模型 。 

描述 一 个 物体 所 需 的 信息 包括 : 物体 的 形状 ， 以 及 额外 的 特性 (如 决定 物体 如 何 与 光线 交 
互 的 表面 特性 等 )。 现 在 ， 让 我 们 考虑 形状 建 模 这 个 任务 。 

1. 形状 

在 3D 图 形 中 物体 的 形状 通常 描述 成 称 为 平面 片 (planar patch) 的 小 平面 的 集合 ， 其 中 每 一 
个 都 是 一 个 多 边 形 。 这 些 多 边 形 形 成 了 多 边 形 网 格 (polygonal mesh)， 它 近似 于 被 描述 的 物体 
的 形状 〈 见 图 10-2)。 通 过 使 用 小 平面 片 ， 近 似 值 可 达到 所 需 的 精度 。 

多 边 形 网 格 中 的 平面 片 经 常 选择 三 角形 ， 因 为 每 个 三 角形 能 用 它 的 3 个 顶点 来 表示 , 这 是 在 
三 维 空间 中 确定 一 个 平面 所 需 点 的 最 少数 目 。 在 任何 情况 下 ， 多 边 形 网 格 都 可 表示 成 其 平面 片 
顶点 的 集合 。 

一 个 物体 的 多 边 形 网 格 的 示 现 可 以 通过 多 种 途径 获得 。 其 中 一 种 是 : 以 所 需 形 状 的 精确 的 
几何 描述 开始 ,然后 用 这 个 描述 构建 多 边 形 网 格 。 例 如 ,解析 几何 中 半径 为 rz 的 球 〈 中 心 在 原点 ) 
用 方程 来 描述 是 : 








P=2+y+2 

基于 这 个 公式 ， 我 们 可 以 建立 球 上 经 线 和 纬 线 的 方程 ， 标 识 这 些 线 的 交叉 点 ， 然 后 使 用 这 些 点 
作为 多 边 形 网 格 中 的 顶点 。 类 似 的 技术 可 以 应 用 到 其 他 传统 的 几何 形状 上 ， 这 就 是 为 何在 廉价 
的 计算 机 动画 中 人 物 角 色 经 常 由 球 、 圆 柱 体 和 锥 体 这 些 结构 拼凑 的 原因 。 

更 一 般 的 形状 可 以 用 更 复杂 的 分 析 方法 来 描述 。 其 中 一 种 方法 是 使 用 贝 塞 尔 曲线 (Bezier 
curve) (以 皮 埃 尔 。 贝 塞 尔 命名 ， 他 在 20 世 纪 70 年 代 早期 提出 了 这 个 概念 ， 当 时 他 是 雷诺 汽车 
公司 的 工程 师 ), 它 允 许 在 三 维 空间 中 只 用 几 个 称 为 控制 点 的 点 来 定义 曲线 段 (其 中 有 两 个 点 表 
示 曲 线段 的 端点 ， 而 其 他 的 点 则 指出 曲线 的 弯曲 方式 )。 例 如 ， 图 10-3 显 示 了 由 4 个 控制 点 定义 的 


10.3 建 模 323 


曲线 。 注 意 ， 曲 线 显示 为 弯 向 两 个 不 为 端点 的 控制 点 。 通 过 移动 这 些 点 ， 曲 线 可 以 被 扭曲 成 不 同 
的 形状 。( 当 你 用 像 微 软 的 “画图 ”软件 这 样 的 绘图 软件 包 来 构建 曲线 时 ， 就 能 体验 到 这 种 技术 。) 
尽管 我 们 在 这 里 不 再 继续 探讨 这 个 话题 ， 但 描述 曲线 的 贝 塞 尔 技术 可 以 扩展 为 描述 三 维 曲面 ， 称 
为 贝 塞 尔 曲面 《Bezier surface )。 因 此 ， 对 于 复杂 表面 ， 在 获得 多 边 形 网 格 的 过 程 中 ， 贝 塞 尔 曲面 


被 证 明 是 高 效 的 第 一 步 。 








图 10-2 球 的 多 边 形 网 格 


Me 


标识 曲线 端点 的 控制 点 





用 来 扭曲 曲线 的 控制 点 


图 10-3” 贝 塞 尔 曲 线 


你 可 能 会 问 为 什么 需要 使 用 多 边 形 网 格 把 形状 的 精确 描述 (如 球 的 简明 公式 ， 或 描述 贝 塞 


尔 表面 的 公式 ) 转化 为 形状 的 近似 描述 。 答 案 是 用 多 边 形 网 
格 表示 所 有 物体 的 形状 确立 了 泻 染 处 理 的 统一 方法 一 一 可 以 
更 高 效 地 泻 染 整个 场景 的 技巧 。 这 样 ， 尽 管 几何 公式 提供 了 
形状 的 精确 描述 ， 但 它们 只 是 作为 构建 多 边 形 网 格 的 工具 。 

另外 一 种 获得 多 边 形 网 格 的 方法 是 用 蛮 力 的 方式 构建 
网 格 。 在 无 法 用 优雅 的 数学 技术 表示 形状 的 情况 下 ， 这 种 方 
法 就 比较 常见 了 。 在 这 个 过 程 中 ， 首 先 构建 物体 的 物理 模型 ， 
然后 用 类 笔 设备 触摸 表面 ， 记 录 下 模型 表面 点 的 位 置 ， 这 种 
笔 设备 能 记录 它 在 三 维 空间 中 的 位 置 , 此 过 程 就 称 为 数字 化 
(digitizing)。 然 后 将 获得 的 点 的 集合 用 作 顶 点 ， 从 而 获得 所 
描述 形状 的 多 边 形 网 格 。 

遗憾 的 是 ， 有 些 形状 非常 复杂 ， 难 以 用 几何 建 模 或 手工 数 
字 化 获得 真实 模型 。 这 些 例子 包括 : 复杂 植物 结构 (如 树 )、 
复杂 地 形 ( 如 山脉 )， 以 及 云 、 烟 、 火 苗 等 气态 物质 。 在 这 些 
情况 下 ， 多边形 网 格 可 以 通过 编写 自动 构建 所 需 形状 的 程序 来 
获得 。 这 样 的 程序 统称 为 程序 化 模型 (procedural model)。 换 
言 之 ， 程 序 化 模型 是 应 用 算法 产生 所 需 结构 的 程序 单元 。 

例如 ， 通 过 执行 下 列 步 又， 程序 化 模型 被 用 来 产生 山脉 
以 一 个 三 角形 开始 ， 标 识 三 条 边 的 中 点 〈 见 图 10-4a); 然后 连 
接 这 些 中 点 ， 形 成 4 个 较 小 的 三 角形 〈 见 图 10-4b); 现在 在 把 原 
三 角形 的 3 个 顶点 固定 住 的 同时 , 在 三 维 空 间 里 移动 中 间 点 (人 允 
许 三 角形 的 边线 延长 或 缩短 )， 从 而 扭曲 三 角形 的 形状 〈 见 图 
10-4c); 对 于 每 个 较 小 的 三 角形 重复 这 个 过 程 ( 见 图 10-4d)， 
继续 重复 这 个 过 程 ， 直 到 达到 所 需 的 精度 。 





中 点 
中 点 


中 点 
(a) 标识 中 点 


中 点 
(b) 连接 中 点 





(c) 移动 中 点 





MA 
(d) 在 更 小 的 三 角形 上 重复 这 个 过 程 
图 10-4 ”产生 一 个 山脉 的 多 边 形 网 格 
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程序 化 模型 提供 了 一 种 有 效 的 方法 ， 来 产生 多 个 相似 而 又 唯一 的 复杂 对 象 。 例 如 ， 一 个 程 
序 化 模型 可 以 用 来 构建 各 种 各 样 逼 真 的 树 对 象 〈 虽 然 相 似 ， 但 每 棵 树 都 有 自己 的 分 支 结构 )。 构 
建 这 些 树 模型 的 一 种 方法 是 应 用 分 支 规则 ， 即 用 与 语法 分 析 器 〈 见 6.4 节 ) 按 语法 规则 构建 语法 
分 析 树 非常 相似 的 方法 来 “生成 ” 树 对 象 。 事 实 上 ， 在 这 些 情况 下 使 用 的 分 支 规则 的 集合 经 常 
被 称 为 语法 。 一 个 语法 可 能 被 用 来 “生成 ”松树 ， 而 另外 一 个 可 能 用 来 “生成 ”橡树 。 

另 一 种 构建 程序 化 模型 的 方法 是 将 物体 的 基础 结构 模拟 为 一 个 大 的 粒子 集合 。 这 种 模型 称 
为 粒子 系统 (particle system )。 粒 子 系统 通常 会 应 用 某 些 预定 义 的 规则 去 移动 系统 中 的 粒子 (或 
许 所 用 的 方式 会 让 人 想起 分 子 的 交互 ), 来 生成 所 需 的 形状 。 例 如 ， 粒 子 系统 已 经 被 用 来 生成 水 
面 晃动 的 动画 ， 我 们 将 在 后 面 介绍 动画 时 看 到 。( 想 象 一 下 ， 把 一 桶 水 建 模 为 一 桶 玻璃 弹 珠 ， 当 
桶 滚动 时 ， 玻 璃 弹 珠 也 随 之 四 处 翻滚 ， 模 拟 水 的 运动 。) 粒子 系统 应 用 的 其 他 例子 包括 : 火苗 的 
闪烁 、 云 、 拥 挤 的 人 群 场景 。 
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在 上 文中 描述 了 用 程序 化 模型 构建 山脉 ( 见 图 10-4)， 这 是 分 形 作 用 于 3DD 图 形 的 例子 ， 
从 技术 上 讲 ， 分 形 (fractal ) 是 “ 豪 斯 多 夫 维 数 大 于 其 拓扑 维 数 ”的 几何 物体 。 直观 上 讲 ， 
这 意味 着 物体 是 通过 较 低 维 数 物 体 的 副本 “打包 ?” 而 形成 的 。( 想象 一 下 宽度 就 是 通过 “打包 ” 
多 条 平行 线段 而 创建 的 。) 分 形 通常 是 使 用 递归 过 程 来 形成 的 ,而 在 递归 中 的 每 个 处 理 就 是 重 
复 “ 打 包 ” 另 外 用 来 建立 分 形 模式 (更 小 ) 的 副本 。 分 形 的 结果 是 其 每 个 部 分 都 是 自 相 似 的 ， 
当 放 大 时 ， 它 显示 为 自身 的 副本 。 

分 形 的 一 个 传统 的 示例 就 是 科 赫 雪花 ， 它 是 通过 重复 地 用 相同 结构 的 较 小 版 本 替换 结构 
中 的 直线 段 而 形成 的 。 





生成 的 细 化 序列 如 下 所 示 : 而 
分 形 在 3D 图 形 领域 经 常 是 程序 化 模型 的 主干 . 实际 上 , 它们 已 经 被 用 来 生成 逼真 的 山脉 、 
蔬菜 、 云 和 烟 的 图 像 。 


程序 化 模型 的 输出 通常 是 近似 于 所 需 物 体形 状 的 多 边 形 网 格 。 在 某 些 情况 下 ， 如 使 用 三 角 
形 生 成 山脉 ， 网 格 就 是 生成 过 程 的 自然 结果 。 在 另外 一 些 情况 下 ， 如 应 用 分 支 规则 生成 树 ， 网 
格 可 能 就 是 额外 的 、 最 终 的 步骤 。 例 如 ， 在 粒子 系统 中 ， 系 统 外 边沿 上 的 粒子 自然 会 被 选 作 最 
终 多 边 形 网 格 中 的 顶点 。 

由 程序 化 模型 生成 的 网 格 的 精度 视 具 体 情况 而 定 。 在 场景 中 ， 用 于 背景 中 的 树 的 程序 化 模 
型 可 能 只 要 产生 一 个 反映 树 基 本 形状 的 粗糙 的 网 格 ， 而 前 景 中 的 树 的 程序 化 模型 就 要 产生 能 分 
清 各 个 枝叶 的 网 格 。 

2. 表面 特征 

仅 由 多 边 形 网 格 构成 的 模型 只 捕获 了 物体 的 形状 。 大 多 数 泻 染 系 统 能 在 泻 染 过 程 中 丰富 这 
些 模型 ， 根 据 用 户 的 需求 模拟 各 种 表面 特征 。 例 如 ， 通 过 使 用 不 同 的 着 色 技术 (我 们 将 在 10.4 
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节 介绍 )， 用 户 可 以 指定 球 的 多 边 形 网 格 被 泻 染 成 光滑 的 红 球 或 是 粗糙 的 绿 球 。 在 某 些 情况 下 ， 
这 种 灵活 性 是 可 以 做 到 的 。 但 在 需要 如 实 泻 染 原始 物体 的 情况 下 ， 关 于 物体 的 更 具体 的 信息 必 
须 包 含 在 模型 中 ， 这 样 泻 染 系统 才 会 知道 该 干什么 。 

除了 物体 形状 之 外 ， 还 有 多 种 用 于 编码 物体 相关 信息 的 技术 。 例 如 ， 沿 着 多 边 形 网 格 的 每 
个 顶点 ， 人 们 可 以 在 物体 的 这 一 点 上 编码 原始 物体 的 颜色 。 然 后 在 泻 染 过 程 中 用 这 些 信息 重新 
创建 原始 物体 的 外 观 。 

在 其 他 的 例子 中 ， 通 过 称 为 纹理 映射 (texture mapping) 的 处 理 ， 颜 色 模 式 能 与 物体 表面 相 
关联 。 纹 理 映射 类 似 于 贴 墙纸 ， 将 一 个 预定 义 的 图 像 与 一 个 物体 的 表面 相关 联 。 这 个 图 像 可 能 
是 数字 照片 、 艺 术 家 的 绘画 ， 也 可 能 是 计算 机 生成 的 图 像 。 传 统 的 纹理 图 像 包 括 砖 墙 、 有 本 纹 
的 表面 和 大 理 石 表面 。 

例如 ， 假 设 我 们 需要 对 石 墙 建 模 ， 我 们 可 以 用 描述 长 矩形 体 的 简单 多 边 形 网 格 来 表示 墙 的 
形状 。 利 用 这 些 网 格 ， 我 们 就 能 提供 砖 石 结构 的 二 维 图 像 。 随 后 ， 在 泻 染 过 程 中 ， 将 这 个 图 像 
映射 到 和 矩形 体 上 ， 产 生 石 墙 的 外 观 。 更 准确 地 ， 每 当 演 染 处 理 需 要 显示 墙 上 的 点 时 ， 它 就 只 需 
显示 砖 石 结构 图 像 中 对 应 的 点 。 

当 应 用 于 相对 平坦 的 表面 时 ， 纹 理 映射 的 效果 最 好 。 如 果 必 须 大 幅 扭曲 纹理 图 像 去 覆盖 弯 
曲 的 表面 (想象 成 试图 给 一 个 沙滩 球 贴 墙纸 的 问题 ), 或 者 如 果 纹 理 图 像 完全 于 着 一 个 物体 ， 并 
导致 了 接 颖 ， 在 接 颖 处 纹理 模式 可 能 不 与 它 本 身 融 合 ， 那 么 效果 看 上 去 会 不 够 逼真 。 不 过 ， 纹 
理 映 射 已 经 被 证 明 是 一 种 模拟 纹理 的 有 效 方法 ， 它 被 广泛 地 用 在 实时 敏感 的 场合 (一 个 基本 的 
例子 就 是 交互 式 视频 游戏 )。 

3. 寻求 逼真 的 效果 

构建 可 以 产生 逼真 图 像 的 物体 模型 是 一 个 正在 研究 的 主题 ， 特 别 有 趣 的 是 当前 角色 的 材质 ， 
如 皮肤 、 头 发 、 毛 皮 和 羽毛 等 。 这 些 研 究 大 多 是 针对 特殊 物质 的 ， 包 括 建 模 和 演 染 技术 。 例 如 ， 
为 了 获得 人 类 皮肤 的 逼真 模型 ， 有 些 学 者 研究 光 渗 透 到 表皮 和 真皮 层 的 程度 以 及 这 些 层 的 厚度 
对 皮肤 外 观 的 影响 。 

男 一 个 例子 是 人 类 头发 的 建 模 。 如 果 从 远 距离 来 看 头发 ， 那 么 传统 的 建 模 技 术 就 是 够 了 。 但 是 ， 
从 近 距 离 看 ， 头 发 的 显示 将 会 是 一 个 挑战 。 其 中 的 问题 包括 : 半 透 明 的 特性 、 纹 理 的 深度 、 葵 垂 性 和 
头发 响应 像 风 这 样 的 外 力 的 方式 。 为 了 解决 这 些 棘手 的 问题 ， 有 些 应 用 程序 转向 对 单 缕 头发 建 模 〈 这 
是 一 项 艰巨 的 任务 ， 因 为 人 的 头发 根 数 的 数量 级 达到 了 100 000)。 但 是 ， 更 令 人 惊奇 的 是 ， 有 些 研究 
者 已 经 建立 了 头发 模型 ， 这 些 模型 给 出 了 每 一 缕 头 发 的 缩放 纹理 、 颜 色 变化 和 机 械 动 力学 特征 。 

另外 一 个 已 经 发 展 到 相当 精确 建 模 程度 的 例子 是 布 的 建 模 。 在 这 个 例子 中 ， 利 用 了 编织 模 
式 的 复杂 细节 ， 来 生成 织物 类 型 〈 像 斜纹 布 与 纵 布 ) 之 间 恰 当 的 纹理 差别 。 将 纱 线 的 细节 特性 与 
编织 模式 数据 组 合 在 一 起 ， 创 建 出 编织 物 的 模型 ， 产 生 通 真 的 特效 图 像 。 另 外 ， 还 将 物理 和 机 械 
工程 的 知识 应 用 到 计算 织物 材料 图 像 的 单 根 线 上 去 ， 以 说 明 线 的 拉 伸 和 织物 修 前 方面 的 特性 。 

正如 我 们 所 说 ， 生 成 逼真 图 像 是 一 个 活跃 的 研究 领域 ， 它 综合 了 建 模 和 这 染 处 理 中 的 技术 。 
一 般 来 说 ， 当 取得 进步 时 ， 新 技术 会 首先 应 用 在 那些 不 受 实时 限制 影响 的 应 用 程序 中 ， 如 电影 
制 片 三 工作 室 中 的 图 形 软件 ， 建 模 / 泻 染 处 理 与 最 终 的 图 像 显示 之 间 有 着 明显 的 延迟 。 当 这 些 新 
的 技术 得 到 进一步 发 展 并 变 得 更 高 效 时 ， 它 们 就 可 以 应 用 在 实时 系统 中 了 ， 在 这 些 环境 中 的 图 
形 质量 也 得 到 了 改善 。 真 正 实现 与 虚拟 世界 的 实时 交互 可 能 已 经 不 太 遥 远 了 。 


10.3.2 ”整个 场景 的 建 模 


一 旦 场景 中 的 物体 得 到 充分 的 描述 和 数字 化 编码 ， 它 们 就 都 被 赋予 了 场景 内 的 位 置 、 大 小 
和 方向 。 将 这 些 信息 集合 并 链接 起 来 ， 形 成 一 个 称 为 场景 图 (scene graph) 的 数据 结构 。 此 外 ， 


328 第 10 章 计算 机 图 形 学 


场景 图 还 包含 与 表示 光源 的 特殊 物体 及 表示 相机 的 特殊 物体 的 链接 ， 其 中 记录 了 相机 的 位 置 、 
方向 和 焦点 等 特性 。 

因此 ， 场 景 图 类 似 于 传统 摄影 中 的 工作 室 布置 ， 它 包括 布置 相机 、 灯 光 、 道 具 和 背景 景物 
〈 当 按 快门 时 ， 所 有 的 东西 都 将 对 照片 的 外 观 产生 影响 )。 所 不 同 的 是 ， 传 统 摄影 设置 包含 物理 
实体 ， 而 场景 图 包含 的 是 物体 的 数字 编码 表示 。 简 而 言 之 ， 场 景 图 描述 的 是 一 个 虚拟 的 世界 。 

场景 中 相机 的 位 置 会 对 图 像 产 生 很 大 的 影响 。 正 如 先前 提 到 的 ， 物 体 建 模 的 精度 依赖 于 物 
体 在 场景 中 的 位 置 。 前 景物 体 比 背 景物 体 需 要 更 多 的 细节 ， 前 景 和 背景 的 区 别 依赖 于 相机 的 位 
置 。 如 果 使 用 的 场景 环境 类 似 于 戏剧 舞台 布景 ， 那 么 前 景 和 背景 就 很 好 区 分 ， 物 体 模型 也 能 被 
相应 地 构建 。 但 是 ， 如 果 环 境 要 求 相 机 的 位 置 要 根据 不 同 的 图 像 而 改变 ， 那 么 由 物体 模型 提供 
的 细节 就 需要 在 “照片 ” 间 进 行 调整 ， 这 是 当前 研究 的 一 个 领域 。 一 种 设想 是 ， 场 景 由 “智能 ” 
模型 构成 ， 当 相机 在 场景 中 移动 时 ， 这 些 模 型 改进 了 它们 的 多 边 形 网 格 和 其 他 特性 。 

移动 相机 情景 的 一 个 有 趣 的 例子 发 生 在 虚拟 现实 系统 中 ， 用 户 可 以 借助 它 来 体验 在 虚构 的 
三 维 世 界 里 走 来 走 去 的 感觉 。 虚 构 的 世界 用 场景 图 表示 ， 而 人 通过 操控 照相 机 来 观察 其 中 的 场 
景 。 实 际 上 ， 为 了 提供 三 维 的 深度 感 ， 可 以 使 用 两 个 相机 : 一 个 表示 人 的 右 眼 ， 另 一 个 表示 人 
的 左 眼 。 通 过 显示 由 每 只 眼睛 前 的 照相 机 获得 的 图 像 ， 人 们 产生 了 居住 在 三 维 场景 中 的 幻觉 。 
当 在 体验 中 增加 声音 和 触觉 时 ， 这 种 幻觉 就 变 得 十 分 允 真 。 

最 后 ， 我 们 应 该 注意 到 ， 场 景 图 的 构建 在 3D 图 形 处 理 中 非常 重要 。 因 为 它 包含 了 生成 最 终 
图 像 所 需 的 所 有 信息 ， 它 的 完成 标志 着 艺术 建 模 过 程 的 终止 和 以 计算 为 主 的 图 形 演 染 过 程 的 开 
始 。 实 际 上 ， 场 景 图 一 旦 建立 ， 图 形 学 的 任务 就 变 成 了 计算 投影 、 确 定 特定 点 的 表面 细节 和 模 
拟 光 效 无 
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六 直 兴 一 冯 匠 六 岂 才 在 电视 让 本 训 D 彩 像 pp 即 对 于 
左右 眼看 到 的 两 个 稍稍 不 同 的 图 像 ， 大 脑 可 以 依 此 判断 出 深度 。 就 这 一 方面 而 言 ， 现 今 最 便 
宜 的 装置 需要 具有 滤 光 镜 。 较 老 的 有 色 镜 片 (20 世 纪 50 年 代用 于 电影 院 中 ) 或 更 现代 的 偏光 
镜片 会 过 滤 掉 屏幕 上 同一 图 像 的 不 同方 面 ， 从 而 使 左右 眼看 到 不 同 的 图 像 . 较 昂 贵 的 技术 则 涉 
及 “主动 式 ” 眼 镜 ， 它 与 快速 切换 左右 图 像 的 3D 电 视 同步 地 交替 开关 左右 镜片 。 最 后 ， 不 需要 
特殊 眼镜 或 头 部 装置 的 3D 电 视 正 在 研发 之 中 ， 它 们 在 屏幕 表面 精心 排放 一 组 滤 光 镜 或 放大 镜 ， 
从 而 将 左右 图 像 以 稍稍 不 同 的 角度 投射 给 观看 者 ， 从 而 使 观看 者 的 左右 眼看 到 不 同 的 图 像 。 





问题 与 练习 


. 下 面 是 4 个 点 《使 用 传统 的 直角 坐标 系 编码 ) ， 它 们 表示 平面 片 的 顶点 。 描 述 面 片 的 形状 。 (对 于 没 
有 解析 几何 背景 知识 的 人 , 这 里 解释 一 下 。 每 个 三 元 组 表示 的 是 如 何 从 房间 中 的 一 个 角落 到 达 问 题 中 
的 那个 点 。 第 一 个 数 表示 沿 着 地 板 和 位 于 你 右边 的 墙 之 间 的 接 颖 走 多 远 ; 第 二 个 数 表示 沿 与 位 于 你 左 
边 的 墙 平行 的 方向 上 向 房间 里 走 多 远 ; 第 三 个 数 表 示 从 地 板 向 上 疏 多 高 。 如 果 有 一 个 数 是 负数 ， 你 将 
不 得 不 假装 你 是 一 个 幽灵 ， 可 以 穿 过 墙 和 地 板 。) 

Or Ol a Ol 0) 
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. 什么 是 程序 化 模型 ? 

: 列 出 一 些 在 生成 一 个 公园 图 像 的 场景 图 中 可 能 出 现 的 物体 。 

.既然 可 以 用 几何 方程 更 精确 地 表示 形状 ， 为 什么 还 要 用 多 边 形 网 格 来 表示 ? 
. 什么 是 纹理 映射 ? 


nD 


10.4 泻 染 





现在 让 我 们 考虑 泻 染 的 处 理 ， 它 决定 了 当场 景 图 中 的 物体 投影 到 投影 平面 时 ， 将 如 何 显示 。 
有 几 种 方法 可 以 完成 泻 染 任务 。 这 一 节 着 重 介绍 当今 “消费 者 市 场 ”上 大 多 数 较 流行 的 图 形 系统 
《视频 游戏 、 家 庭 计算 机 等 ) 所 使 用 的 传统 方法 。 下 一 节 将 讨论 其 他 两 个 可 供 选择 的 解决 方案 。 

首先 探讨 光 和 物体 间 交 互 的 一 些 背 景 信息 。 毕 竟 , 物体 的 外 观 是 由 从 物体 发 出 的 光 决 定 的 ， 
因此 确定 物体 的 外 观 这 一 任务 最 终 变 成 了 对 光 的 特性 的 模拟 。 


10.4.1 光一 表面 交互 


依赖 于 物体 的 材料 特性 ， 照 射 到 其 表面 的 光 可 能 会 被 吸收 、 从 表面 反射 回来 成 反射 光 ， 或 
者 穿 过 表面 〈 被 弯曲 ) 成 折射 光 。 

1. 反射 

让 我 们 考虑 从 一 个 平坦 不 透明 表面 反射 的 光线 。 光 线 沿 直线 传播 ， 以 一 个 角度 照射 到 表面 
上 ， 这 个 角度 称 为 入 射 角 (incidence angle)。 光 线 的 反射 角 与 入 射 角 相 同 ， 如 图 10-5 所 示 ， 这 些 
角度 是 相对 于 垂直 于 表面 的 线 [ 即 法 线 (normal)] 来 测量 的 。( 垂 直 于 表面 的 线 经 常 简单 地 表 
示 为 “法 线 ” 这 样 就 可 以 说 “入 射 角 是 相对 于 法 线 度量 的 ”) 入 射 光 线 、 反 射 光 线 和 法 线 在 同 
二 个 平面 中 。 


光源 法 线 





图 10-5 ”反射 光 


如 果 表 面 是 光滑 的 ， 在 相同 区 域 照射 到 表面 的 平行 光线 (如 那些 来 自 同 一 光源 的 光线 ) 就 
会 以 相同 的 方向 反射 ， 并 作为 平行 光线 离开 物体 。 这 些 反 射 光 称 为 镜面 反射 光 (specular light)。 
注意 ， 只 有 当 表 面 和 光源 使 得 光 反 射 到 观察 者 的 方向 上 ， 镜 面 反射 光 才 能 被 观察 到 。 因 此 ， 它 
通常 显示 为 表面 上 明亮 的 高 亮 区 。 而 且 ， 因 为 镜面 反射 光 与 表 面 的 接触 时 间 最 短 ， 这 使 它 非常 
接近 原始 光源 的 颜色 。 

但 是 ， 物 体 表 面 很 少 是 绝对 光滑 的 ， 因 此 许多 光线 在 表面 照射 点 的 方向 会 与 大 多 数 普 通 表 
面 的 不 同 。 而 且 ， 光 线 经 常 穿 透 表面 邻接 的 边界 ， 在 表面 的 粒子 间 跳 弹 ， 最 后 作为 反射 光线 离 
开 。 结 果 是 许多 光线 将 向 不 同 的 方向 散 开 。 这 种 散 开 的 光 称 为 散射 光 〈diffuse light)。 与 镜面 反 
射 光 不 同 ， 散 射 光 在 一 定 范围 的 方向 内 是 可 见 的 。 此 外 ， 散 射 光 与 表面 的 接触 时 间 长 ， 更 容易 
受 材 料 吸 收 特性 的 影响 ， 因 此 它 更 接近 物体 的 颜色 。 

图 10-6 表 示 了 一 个 被 单个 光源 照射 的 球 。 球 上 明亮 的 高 亮 区 是 镜面 反射 光 产 生 的 ， 通 过 散 
射 光 ， 可 以 看 见面 向 光源 的 半球 的 其 他 部 分 。 注 意 ， 球 面 背 着 主 光 源 的 半球 无 法 通过 直接 反射 光 
源 而 被 看 见 。 球 的 这 部 分 能 够 被 看 见 是 由 于 环境 光 (ambient light) 的 存在 ， 它 是 “漂泊 ”或 散 开 
的 光 ， 不 与 任何 特定 的 光源 或 方向 相关 联 。 被 环境 光照 射 的 表面 部 分 经 常 显示 为 统一 的 深 色 。 
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镜面 反射 光 


散射 光 





图 10-6 镜面 反射 光 与 散射 光 

大 多 数 表面 既 反 射 镜面 反射 光 又 反射 散射 光 ， 表 面 的 特征 决定 了 镜面 反射 光 和 散射 光 的 比 
例 。 平 滑 表面 看 起 来 发 亮 的 原因 在 于 ， 它 们 反射 的 镜面 反射 光 多 于 散射 光 ; 粗糙 表面 看 起 来 为 
发 暗 是 因为 它们 反射 的 散射 光 多 于 镜面 反射 光 。 而 且 ， 由 于 某 些 表面 具有 细微 的 特性 ， 入 射 光 
的 方向 不 同 ， 镜 面 反 射 光 和 散射 光 的 比例 也 会 有 所 不 同 ， 从 一 个 方向 入 射 的 光照 射 到 这 样 的 表 
面 上 可 能 反射 的 主要 是 镜面 反射 光 ， 而 从 另 一 个 方向 入 射 的 光照 射 到 这 个 表面 上 可 能 反射 的 主 
要 是 散射 光 。 因 此 ， 当 表面 旋转 时 ， 它 的 外 观 将 从 明亮 变化 为 灰暗 。 这 种 表面 称 为 各 向 异性 表 
面 (anisotropic surface)， 与 各 向 异性 表面 相对 的 是 各 向 同性 表面 (isotropic surface)， 后 者 的 反 
射 模式 是 对 称 的 。 en 其 中 织物 的 细毛 根据 它 
的 朝向 改变 材料 的 外 观 。 另 外 一 个 例子 是 运动 场 的 草地 表面 ， 那里 草 的 排列 方向 《通常 是 由 草 
被 裁剪 的 方式 决定 的 ) 产生 了 各 向 异性 视觉 效果 ， 如 同 明暗 相间 的 条 纹 图 案 。 

2. 折射 

人 在 此 种 情况 下 ， 光 线 是 穿 过 物体 
而 并 非 从 其 表面 反射 出 去 。 当 光线 穿 透 表 面 时 ， 它 们 的 方向 改变 了 ， er 
Crefraction)， 如 图 10-7 所 示 。 折 射程 度 是 由 相关 材料 的 折射 率 决定 的 。 折 射 率 与 材料 的 密度 有 
%。 济 蓄 商科 料 入 性 比 要 窗 刻 料 料 具有 更 有 的 亲 用 率 。 当 光线 进入 折 寺 尘 殉 有 的 材料 中 办 《如 
从 空气 进入 水 中 )， 它 在 入 射 点 处 向 靠近 法 线 的 方向 弯曲 ， 如 果 光 线 进入 到 折射 率 较 低 的 材料 中 ， 
它 将 向 远离 法 线 的 方向 弯曲 。 





光源 ! 一 法 线 
入 射 光 线 
+ 一 入 射 角 
材料 间 的 边界 
具有 更 高 折 
射 率 的 材料 





折射 角 折射 光线 
图 10-7 折射 光 
为 了 准确 地 泻 染 透明 物体 ， 演 染 软 件 必须 知道 相关 材料 的 折射 率 ， 但 这 还 不 够 ， 泻 染 软 作 
还 必须 知道 物体 表面 的 哪 一 边 表示 物体 的 里 面 ， 而 另 一 边 为 外 面 。 光 线 是 进入 物体 还 是 离开 物 
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体 ? 获得 这 些 信息 的 技术 有 时 相当 巧妙 。 例 如 ， 如 果 规 定 ， 从 外 部 观察 物体 的 时 候 ， 总 是 按 道 
时 针 顺 序 将 多 边 形 网 格 中 多 边 形 的 顶点 依次 存放 在 一 个 列表 中 ， 那 么 通过 给 出 的 列表 ， 我 们 可 
以 很 容易 地 得 知 面 片 的 哪 一 边 表示 物体 的 外 面 。 


10.4.2 裁剪、 扫描 转换 和 隐藏 面 的 消除 


现在 着 重 考虑 从 场景 图 生成 图 像 的 过 程 。 我 们 目前 使 用 的 方法 正 是 在 大 多 数 交 互 式 视频 游 
戏 系统 中 使 用 的 技术 。 综 合 应 用 这 些 技 术 ， 形 成 了 一 个 固定 下 来 的 范式 ， 称 为 泻 染 流水 线 
(rendering pipeline)。 在 本 节 的 末尾 我 们 将 介绍 这 种 方法 的 一 些 优 缺点 ， 在 下 一 节 将 探讨 两 种 候 
选 的 方法 。 值 得 一 提 的 是 ， 泻 染 流水 线 处 理 不 透明 物体 非常 有 效 ， 因 此 折射 就 不 是 问题 了 。 而 
且 ， 它 忽略 了 两 个 物体 之 间 的 相互 影响 ， 因 此 我 们 不 必 担 心 镜像 和 阴影 问题 。 

ee 
这 个 区 域 称 为 视 体 (view volume)， 它 是 锥 体内 的 一 个 空间 ， 这 个 锥 体 是 由 从 投影 中 心 出 发 向 
图 像 窗口 边界 延伸 的 直线 所 定义 的 〈 见 图 10-8)。 


图 像 窗口 





投影 中 心 只 视 体 内 的 物体 部 分 
显示 在 图 像 窗 口中 


图 10-8 ”确定 视 体 里 面 的 场景 区 域 
一 旦 视 体 被 确定 下 来 ， 就 不 用 考虑 那些 与 视 体 不 相交 的 物体 或 物体 部 分 了 。 毕 竞 ， 那 部 分 的 场 
景 投影 将 落 在 图 像 窗 口 的 外 面 ， 因 此 不 会 出 现在 最 终 的 图 像 中 。 第 一 步 就 是 去 除 完全 在 视 体 外 面 的 
物体 。 为 了 能 够 以 流水 线 的 形式 进行 处 理 ， 可 以 将 场景 图 看 作 一 个 树 型 结构 ， 其 中 处 在 场景 不 同 区 
域 的 物体 被 存储 在 不 同 的 分 支 上 。 因 此 ， 仅 需 忽 略 树 中 的 整个 分 支 ， 就 可 以 去 除 大 部 分 的 场景 图 。 













你 是 否 注意 到 条 纹 衬衫 和 领带 在 电 i 
(aliasing ) 的 现象 产生 的 结果 ， 当 所 期 这 
时 ， 就 会 产生 走样 现象 。 例 如 ， 假 
有 像素 的 中 心 碰巧 都 落 在 黑色 条 级 将 被 当 
稍微 移动 一 下 ， 所 有 像素 的 中 心 可 能 部 落 在 白色 条 纹 上 ， 上 
多 种 方法 可 以 改善 这 种 令 人 心烦 的 效果 . 其 中 一 种 就 是 使 用 图 像 小 区 
单个 点 来 泻 染 每 一 个 像素 
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确定 和 去 除 那 些 与 视 体 不 相交 的 物体 后 ， 剩 余 的 物体 通过 称 为 裁剪 〈clipping) 的 操作 加 以 
整理 ， 裁 前 实际 上 就 是 去 掉 每 个 物体 处 在 视 体外 面 的 部 分 。 更 准确 点 说 ， 裁 前 操作 首先 把 每 个 
平面 片 与 视 体 边界 进行 比较 ， 然 后 去 除 平 面 片 落 在 外 面 的 部 分 。 最 终 得 到 完全 都 处 在 视 体 里 面 
的 多 边 形 网 格 〈 可 能 是 被 裁剪 的 平面 片 )。 

泻 染 流水 线 的 下 一 步 是 确定 剩余 平面 片上 的 点 ， 这 些 点 与 最 终 图 像 中 的 像素 位 置 相 关 。 只 
有 这 些 点 将 会 对 最 终 图 像 产生 影响 ， 认 识 到 这 一 点 是 很 重要 的 。 如 果 物 体 上 的 细节 落 在 两 个 像 
素 位 置 的 中 间 ， 那 它 就 不 能 用 1 像素 来 表示 ， 因 此 将 不 会 显示 在 最 终 图 像 中 。 这 就 是 像素 数 在 数 
码 相 机 市 场 被 着 重 宣传 的 原因 。 像 素 点 数 越 高 ， 小 的 细节 就 越 容易 被 拍摄 在 照片 中 。 

像素 位 置 与 场景 中 的 点 相关 联 的 过 程 称 为 扫描 转换 (scan conversion) 〈 因 为 它 涉及 把 面 片 
转化 为 称 为 扫描 线 的 水 平 像素 行 ) 或 光栅 化 (rasterization)( 因 为 像素 的 一 个 阵列 称 为 一 个 光栅 )。 
扫描 转换 是 这 样 实现 的 : 首先 让 投影 中 心 发 出 的 直线 〈 投 影 线 ) 穿 过 图 像 窗 口中 的 每 个 像素 位 
置 ; 然后 找到 这 些 投影 线 与 平面 片 的 交点 ; 最 后 ,根据 这 些 交 点 我 们 得 到 物体 在 图 像 上 的 外 观 。 
实际 上 ， 这 些 点 在 最 终 图 像 中 是 由 像素 表示 的 。 

图 10-9 描 述 了 单个 三 角 面 片 的 扫描 转换 。 图 10-9a 显 示 了 如 何 通过 投影 线 实现 一 个 像素 位 置 
与 面 片上 一 个 点 的 关联 ， 图 10-9b 显 示 了 通过 扫描 转换 得 到 的 面 片 的 像素 图 像 。 像 素 的 整个 阵 
列 〈 光 栅 ) 由 网 格 来 表示 ， 与 三 角形 相关 的 像素 已 经 被 着 色 。 注 意 ， 这 个 图 还 显示 了 当 扫 描 转 
换 的 形状 其 特征 点 小 于 像素 尺寸 时 ， 会 产生 变形 。 大 多 数 拥有 个 人 计算 机 的 用 户 会 经 常 在 显示 
屏 上 看 到 这 种 锯齿 状 的 边缘 。 







分 解 成 像素 位 置 
的 图 像 窗口 
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(b) 显示 三 角 面 片 的 “投影 形状 ”的 光栅 
图 10-9 三 角 面 片 的 扫描 转换 
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遗憾 的 是 ， 整 个 场景 (或 者 即使 是 单个 物体 〉 的 扫描 转换 不 像 扫 描 转换 单个 面 片 那 样 直 观 
明了 。 这 是 因为 ， 当 涉及 多 个 面 片 时 ， 一 个 面 片 可 能 会 遮盖 住 另 一 个 面 片 。 这 样 ， 即 使 投影 线 
与 平面 片 相 交 ， 面 片上 的 这 个 点 在 最 终 图 像 上 也 不 一 定 可 见 。 识 别 和 去 除 场 景 中 被 遮挡 的 点 的 
处 理 称 为 隐藏 面 消除 (hidden-surface removal)。 

隐藏 面 消 除 的 一 个 具体 方法 是 后 面 消除 法 (back face elimination )， 也 就 是 不 考虑 那些 在 多 
边 形 网 格 中 表示 物体 “后 面 ”的 面 片 。 注 意 ， 后 面 消 除法 是 相对 简单 的 ， 因 为 可 以 认为 那些 朝 
向 背 着 相机 的 面 片 是 处 在 物体 后 面 的 。 

但 是 ， 后 面 消除 法 不 能 完全 解决 隐藏 面 消 除 问题 。 例 如 ， 想 象 一 辆 汽车 在 大 楼 前 的 场景 ， 
来 自 汽车 和 大 楼 的 平面 片 将 会 投影 到 图 像 窗 口 的 相同 区 域 。 在 重 辣 发 生 的 地 方 ， 最 终 存 储 在 帧 
缓冲 区 中 的 像素 数据 对 应 的 是 前 景物 体 〈 汽 车 ) 的 外 观 ， 而 不 是 背景 物体 〈 大 楼 ) 的 外 观 。 总 
之 ， 如 果 投 影 线 与 多 个 平面 片 相 交 ， 那 么 最 靠近 图 像 窗 口 的 面 片上 的 点 应 该 被 泻 染 。 

解决 “前 景 /背景 ”问题 的 一 个 简单 方法 是 众所周知 的 画家 算法 (painter’s algorithm )， 就 是 
根据 相机 到 物体 的 距离 ， 在 场景 中 依次 放置 物体 ， 然 后 先 扫 描 转换 最 远 的 物体 ， 人 允许 较 近 物体 
的 扫描 转换 结果 覆盖 先前 的 任何 结果 。 遗 憾 的 是 ， 画 家 算法 不 能 处 理 对 象 纠缠 在 一 起 的 情况 。 
比如 ， 树 的 一 部 分 可 能 在 一 个 物体 的 后 面 ， 而 另 一 部 分 可 能 在 这 个 物体 的 前 面 。 

对 于 “前 景 /背景 ”问题 的 更 彻底 的 解决 方案 是 集中 考虑 单个 像素 ， 而 不 是 整个 物体 。 一 种 
常用 的 技术 就 是 使 用 称 为 z 缓 冲 区 〈z-buffer， 也 称 深度 缓冲 区 〉 的 额外 的 存储 区 域 ， 它 包含 了 
图 像 中 每 个 像素 的 通道 〈 也 可 以 说 是 帧 缓冲 区 中 的 像素 通道 )。z 缓 冲 区 中 的 每 个 位 置 被 用 来 存 
储 沿 着 相应 的 投影 线 从 相机 到 物体 间 的 距离 ， 而 这 些 物 体 用 帧 缓冲 区 中 相应 的 通道 来 表示 。 只 
有 当 像 素数 据 还 没有 放 在 帧 缓冲 区 内 ， 或 者 当前 所 观察 物体 的 点 比 先前 泻 染 的 物体 的 点 更 近 时 
(这 是 由 z 缓 冲 区 中 所 记录 的 距离 信息 决定 的 )， 借助 于 z 绥 冲 区 ， 并 通过 计算 和 存储 像素 的 外 观 ， 
才能 解决 “前 景 /背景 ”问题 。 

更 准确 地 说 ， 当 使 用 z 组 冲 区 时 ， 泻 染 过 程 可 以 按照 如 下 步骤 进行 。 为 z 绥 冲 区 的 所 有 通道 
设 定 一 个 值 ， 表 示 从 相机 到 要 浑 染 物体 间 的 最 大 距离 。 每 当 考 虑 泻 染 平面 片上 的 任何 一 个 新 点 
时 ， 首 先 将 其 与 相机 间 的 距离 和 z 组 冲 区 中 关联 当前 像素 位 置 的 值 进行 比较 。 如 果 距 离 小 于 z 绥 
冲 区 中 的 值 ， 则 计算 点 的 外 观 ， 在 帧 缓冲 区 中 记录 结果 ， 用 刚 泻 染 点 的 距离 蔡 换 z 缓 冲 区 中 的 相 
应 通道 。( 注 意 ， 如 果 此 点 的 距离 大 于 z 组 冲 区 中 相应 的 值 ， 则 不 用 作 任 何 考虑 ， 这 也 许 是 由 于 
平面 上 的 点 太 远 了 ， 或 者 它 被 已 经 泻 染 的 更 近 的 点 遮 住 了 。) 


10.4.3 着色 


- 且 扫 描 转 换 确 定 了 要 显示 在 最 终 图 像 中 的 
平面 片上 的 点 ， 演 染 任务 就 变 成 了 确定 这 个 点 所 
在 面 片 的 外 观 。 这 个 过 程 称 为 着 色 (shading)。 注 
意 ， 着 色 涉 及 计算 从 相应 的 点 投影 到 相机 的 光 的 特 
征 ， 它 取决 于 此 点 表面 的 朝向 。 毕 竟 ， 是 点 表面 的 
朝向 确定 了 镜面 反射 光 、 散 射 光 和 环境 光 被 相机 
拍摄 的 效果 。 

平面 着 色 (flat shading ) 是 着 色 问 题 的 一 个 简 
单 的 解决 方法 ， 它 是 把 平面 片 的 方向 作为 其 上 每 
个 点 的 方向 ， 也 就 是 说 ， 假 设 每 个 面 片上 的 表面 
都 是 平坦 的 。 但 是 ， 最 终 图 像 将 显示 为 图 10-10 那 
样 的 有 棱角 的 ， 而 不 像 图 10-6 中 显示 得 那样 加 。 从 ”图 10-10” 当 用 平面 着 色 泻 染 时 ， 球 的 可 能 显示 
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某 种 意义 讲 ， 平 面 着 色 生 成 的 是 多 边 形 网 格 本 身 的 图 像 ， 而 不 是 用 网 格 建 模 的 物体 图 像 。 

为 了 生成 更 加 逼真 的 图 像 , 演 染 过 程 必须 将 每 个 平面 片 的 外 观 融 合 到 平滑 曲面 显示 的 表面 。 
这 是 通过 估算 每 个 演 染 点 最 初 表面 的 真实 方向 来 完成 的 。 

这 些 估计 模式 通常 始 于 指示 多 边 形 网 格 项 点 处 表面 朝向 的 数据 。 获 得 此 数据 有 多 种 方法 。 
一 种 方法 就 是 在 每 个 顶点 处 编码 原始 表面 的 方向 ， 并 把 这 个 数据 附着 在 多 边 形 网 格 上 ， 作 为 建 
模 过 程 的 一 部 分 。 这 生成 了 一 个 带 箭 头 的 多 边 形 网 格 ， 称 为 法 向 量 (normal vector)， 这 些 箭头 
附着 在 每 个 顶点 上 。 每 个 法 向 量 沿 垂直 于 原始 表面 的 方向 指向 外 部 。 这 样 的 多 边 形 网 格 可 以 想 
象 成 如 图 10-11 所 示 的 样子 。( 另 一 种 方法 是 计算 与 项 点 相 邻 的 每 个 面 片 的 朝向 ， 然 后 使 用 这 些 
朝向 的 “平均 值 ”来 估计 项 点 表面 的 朝向 。) 








问 量 指示 原始 = 一 一 一 
表面 的 朝 问 本 


图 10-11 在 其 顶点 处 带 有 法 向 量 的 多 边 形 网 格 的 概念 视图 


不 管 多 边 形 网 格 顶点 的 原始 表面 朝向 是 如 何 获得 的 ， 都 可 以 用 几 种 同样 的 策略 来 对 基于 这 
些 数据 的 平面 片 进 行 着 色 。 这 些 策略 包括 Gouraud 着 色 (Gouraud shading) 和 Phong 着 色 (Phong 
shading)， 它 们 之 间 的 区 别 是 微妙 的 。 二 者 首先 都 使 用 面 片 顶 点 处 的 表面 朝 癌 信 息 近 似 估计 沿 
着 面 片 边界 的 表面 朝 癌 。 然 后 Gouraud 着 色 使 用 这 些 信息 确定 沿 着 面 片 边界 的 表面 显示 ， 最 后 ， 
根据 这 个 边界 显示 , 插值 估算 面 片 内 部 点 处 的 表面 的 显示 。 相 反 ，Phong 着 色 则 是 根据 沿 着 面 片 
边界 的 表面 朝向 ， 揪 值 估 算 面 片 内 部 点 处 的 表面 朝向 ， 然 后 
只 考虑 显示 问题 。( 总 之 ，Gouraud 着 色 将 朝向 信息 转化 为 颜 
色 信 息 , 然后 插值 处 理 颜 色 信息 ; 而 Phong 着 色 插 值 处 理 朝向 
信息 ， 直 至 估计 出 点 的 朝向 ， 然 后 将 朝向 信息 转化 为 颜色 信 
息 。) 结 果 是 Phong 着 色 更 容易 检测 到 面 片 内 部 的 镜面 反射 光 ， 
因为 它 更 易 随 表面 朝向 的 变化 而 改变 。( 见 本 节 结 尾 处 的 问题 
与 练习 3 。) 

最 后 ， 应 该 注意 到 可 以 扩充 基础 的 着 色 技术 ， 为 表面 添 
加 纹理 显示 。 例 如 ， 四 凸 映射 (bump mapping) 的 方法 ， 实 
际 上 就 是 把 生成 的 表面 外 观 朝 向 加 上 一 个 小 的 变量 ， 这 样 表 
面 看 起 来 就 是 粗糙 的 。 更 准确 地 说 ， 凹 凸 映 射 在 传统 着 色 算 
法 所 使 用 的 插值 算法 中 加 了 一 个 自由 度 ， 这 样 整个 表面 看 起 ”图 10-12 ”使 用 四 凸 映 射 泻 染 时 ， 
来 就 是 有 纹理 的 ， 如 图 10-12 所 示 。 球 的 可 能 显示 


10.4.4 泻 染 一 流水 线 硬 件 


我 们 已 经 说 过 ， 泻 染 流水 线 就 是 依次 执行 裁剪 、 扫 描 转换 、 隐 藏 面 的 消除 和 着 色 处 理 这 些 
操作 。 而 且 ， 执 行 这 些 任务 的 高 效 算法 是 众所周知 的 ， 它 们 已 经 直接 在 电子 电路 中 实现 ， 通 过 
超大 规模 集成 电路 (VLSI) 技术 已 经 被 微缩 成 芯片 ， 自 动 完 成 整个 泻 染 流 水 线 。 如 今 ， 即 使 是 
低廉 的 产品 也 具备 每 秒 泻 染 几 百 万 个 平面 片 的 能 力 。 

大 多 数 专门 进行 图 形 处 理 的 计算 机 系统 〈 包 括 视频 游戏 机 ) 都 在 它们 的 设计 中 加 入 了 这 些 
设备 。 在 更 通用 的 计算 机 系统 中 , 可 以 以 图 形 卡 (graphics card ) 或 图 形 适 配器 (graphics adapter ) 
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的 形式 加 入 这 种 技术 ， 它 作为 一 个 专门 的 控制 器 与 计算 机 的 总 线 连接 〈 见 第 2 章 )。 这 样 的 硬件 
大 大 减少 了 执行 泻 染 处 理 所 需 的 时 间 。 

泻 染 -流水 线 硬件 同样 降低 了 图 形 应 用 软件 的 复杂 度 。 从 本 质 上 讲 ， 所 有 软件 需要 做 的 就 是 
向 图 形 人 硬件 提供 场景 图 ， 然 后 硬件 执行 流水 线 步骤 ， 把 结果 放置 在 帧 缓冲 区 中 。 这 样 ， 从 软件 
的 角度 来 看 ， 整 个 泻 染 流水 线 被 缩减 为 作为 抽象 工具 来 使 用 硬件 这 一 步骤 。 

我 们 再 次 以 交互 式 视 频 游戏 作为 例子 。 为 了 初始 化 游戏 ， 游 戏 软件 把 场景 图 传送 给 图 形 硬 
件 ， 然 后 硬件 演 染 场景 ， 把 图 像 放置 在 帧 缓冲 区 中 ， 从 这 里 图 像 就 可 以 自动 显示 在 监视 屏 上 。 
当 开始 玩 游 戏 时 ， 游 戏 软 件 只 需要 更 新 图 形 硬 件 中 的 场景 图 ， 以 反映 出 游戏 场景 的 改变 ， 而 硬 
件 则 不 断 地 泻 染 场景 ， 每 一 次 都 把 更 新 的 图 像 放 置 在 帧 缓冲 区 中 。 

但 是 应 该 注意 到 ， 不 同 图 形 硬件 的 处 理 能 力 和 通信 特性 是 完全 不 同 的 。 这 就 导致， 如 果 像 视频 
游戏 这 样 的 应 用 是 在 特定 的 图 形 平 台 上 开发 的 ， 当 移植 到 另 一 个 环境 中 时 ， 它 就 不 得 不 进行 修改 。 
为 了 减少 对 特定 图 形 系统 的 依赖 ， 人 们 开发 出 了 在 图 形 硬件 与 应 用 软件 之 间 起 着 重要 调节 作用 的 标 
准 软件 接口 。 这 些 接口 包括 把 标准 化 命令 转化 为 特殊 图 形 人 硬件 系统 所 需 具体 指令 的 软件 例 程 。 这 类 
接口 的 例子 包括 开放 图 形 库 (Open Graphics Library，OpenGL) 和 Direct3D。OpenGL 是 由 Silicon 
Graphics 开 发 的 非 专 有 系统 , 广泛 地 用 在 视频 游戏 行业 ; Direct3D 是 微软 为 微软 Windows 环 境 开 发 的 。 

最 后 应 该 注意 到 ， 虽 然 泻 染 流水 线 具 有 很 多 优点 ， 但 它 也 是 有 人 缺点 的 ， 其 中 最 显著 的 就 是 
流水 线 只 实现 了 局 部 照明 模式 (local lighting model)， 这 意味 着 流水 线 泻 染 的 每 个 物体 是 独立 于 
其 他 物体 的 。 也 就 是 说 ， 在 局 部 照明 模式 下 ， 每 个 物体 都 是 相对 于 光源 被 泻 染 的 ， 仿 佛 它 是 场 
景 中 的 唯一 物体 。 结 果 是 ， 没 有 捕获 到 两 个 物体 之 间 的 光 交 互 ( 如 阴影 和 反射 )。 与 之 相对 ， 全 
局 照明 模式 global lighting model) 就 考虑 了 物体 间 的 交互 。 在 10.5 节 中 我 们 将 讨论 两 种 实现 全 
局 照明 模式 的 技术 。 现 在 我 们 仅 需 注意 ， 这 些 技术 超出 了 当前 技术 的 实时 能 

但 是 ,这 并 不 意味 着 使 用 演 染 流水 线 硬件 的 系统 不 能 够 产生 一 些 全 局 照明 的 效果 。 实 际 上 ， 
人 们 已 经 开发 出 了 巧妙 的 技术 ， 用 来 克服 局 部 照明 模式 所 强加 的 一 些 限制 。 特 别 是 ， 可 以 在 局 
部 照明 模式 的 环境 里 模拟 投影 (drop shadow) 的 显示 《〈 投 在 地 上 的 影子 )， 通 过 建立 投影 物体 
的 多 边 形 网 格 的 副本 ， 把 网 格 副本 变 成 平坦 的 ， 然 后 放 在 地 面 上 ， 涂 以 黑色 。 换 言 之 ， 建 横 阴 

影 ， 就 好 像 它 是 另 一 个 物体 ， 可 以 用 传统 的 泻 染 流水 线 硬件 来 泻 染 ， 生 成 阴影 的 约 觉 。 这 种 技 
术 在 “大 众 水 平 ” 应 用 《〈 如 交互 式 视频 游戏 ) 和 “专业 水 平 ” 应 用 〈 如 飞行 模拟 ) 中 都 很 流行 。 


问题 与 练习 

. 总 结 镜面 反射 光 、 散 射 光 和 环境 光 两 两 之 间 的 区 别 。 

定义 术语 裁剪 和 扫描 转换 。 

. Gouraud 着 色 和 Phong 着 色 可 以 被 总 结 为 : 

Gouraud 着 色 使 用 沿 着 面 片 边 界 的 物体 表面 朝向 确定 沿 着 边界 的 表面 的 显示 ， 然 后 把 这 些 显示 插值 到 
面 片 的 内 部 ， 确 定 特定 点 的 显示 ; Phong 着 色 通过 对 边界 朝向 的 插值 ， 计 算 面 片 内 部 点 的 朝向 ， 然后 
使 用 这 些 朝向 确定 特定 点 的 显示 。 物 体 的 显示 有 何不 同 ? 

4. 演 染 流水 线 的 作用 是 什么 ? 

. 描述 使 用 局 部 照明 模式 ， 如 何 模拟 镜子 中 的 反射 。 


Sa] 


AE 
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研究 者 当前 正在 研究 两 种 可 以 替代 泻 染 流水 线 的 方法 ， 这 两 种 方法 都 实现 了 全 局 照明 模式 ， 
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克服 了 传统 流水 线 中 局 部 照明 模式 的 固有 局 限 。 其 中 一 种 方法 是 光线 跟踪 ， 另 一 种 是 辐射 度 。 
两 种 方法 在 处 理 时 都 极为 精确 但 也 很 费时 ， 在 下 文 马上 就 可 以 看 到 。 


10.5.1 光线 跟踪 


光线 跟踪 (ray tracing) 本 质 上 是 沿 着 光线 进行 反方 向 跟踪 以 找到 它 的 光源 的 过 程 。 这 个 过 
程 首先 选择 要 泻 染 的 像素 ， 确 定 经 过 这 个 像素 和 投影 中 心 的 直线 ， 然 后 跟踪 沿 着 这 条 直线 射 入 
图 像 窗口 的 光线 。 这 个 跟踪 过 程 沿 着 此 直线 进入 场景 ， 直 至 与 物体 相交 。 如 果 这 个 物体 是 光源 ， 
则 终止 光线 跟踪 过 程 ， 将 像素 演 染 为 光源 上 的 一 个 点 ; 否则 ， 计 算 物体 表面 的 特性 ， 以 此 确定 
入 射 光 的 方向 ， 当 前 跟踪 的 光线 是 入 射 光 被 反射 后 产生 的 反射 光线 。 然 后 继续 跟踪 入 射 光线 向 
后 找到 它 的 光源 ， 在 这 点 上 可 能 还 会 有 另 一 条 光线 需要 识别 和 跟踪 。 

图 10-13 给 出 了 一 个 光线 跟踪 的 例子 ， 在 图 中 可 以 看 到 被 跟踪 的 光线 向 后 穿 过 图 像 窗口 ， 到 
达 镜 子 的 表面 ， 从 这 里 跟踪 光线 至 一 个 有 光泽 的 球 ， 再 向 后 到 镜子 ， 然 后 从 镜子 到 光源 。 基 于 
从 这 个 跟踪 过 程 中 获得 的 信息 ， 图 像 中 的 像素 应 该 显示 为 球 上 的 一 点 ， 而 这 个 球 是 被 反射 到 镜 
子 中 的 光源 照 亮 的 。 


镜子 中 的 这 一 点 应 该 泻 染 
为 被 反射 在 镜子 中 的 光线 
照 亮 的 球 的 背面 





投影 中 心 


图 10-13 ”光线 跟踪 


光线 跟踪 的 一 个 缺点 在 于 它 仅 跟 踪 镜 面 反射 光 。 因 此 ， 通 过 这 种 方法 泻 染 的 所 有 物体 往往 
都 显示 为 有 光泽 的 。 可 以 使 用 分 布 式 光线 跟踪 (distributed ray tracing) 来 去 除 这 种 效果 。 分 布 
式 光线 跟踪 与 光线 跟踪 的 区 别 在 于 ， 它 并 不 仅仅 跟踪 从 反射 点 向 后 的 单条 光线 ， 而 是 同时 跟踪 
从 这 个 点 出 发 的 多 条 光线 ， 每 条 光线 的 延伸 方向 略 有 不 同 。 

当 涉 及 透明 的 物体 时 ， 可 应 用 基本 光线 跟踪 的 另 一 个 变 体 。 在 这 种 情况 下 ， 每 当 向 后 跟踪 
光线 至 表面 时 ， 必 须 考虑 两 种 效果 ， 一 种 是 反射 ， 另 一 种 是 折射 。 在 这 种 情况 下 ， 跟 踪 原始 光 
的 任务 分 成 了 两 个 : 回溯 追踪 反射 光 和 回溯 追踪 折射 光 。 

光线 跟踪 通常 是 递归 实现 的 ， 每 次 递归 都 跟踪 光线 到 它 的 源头 。 第 一 次 递归 可 能 跟踪 它 的 
光线 到 一 个 有 光泽 的 不 透明 表面 。 在 这 点 上 ， 此 光线 可 能 被 识别 为 一 条 入 射 光线 的 反射 光 ， 计 
算 这 个 入 射 光 的 方向 ， 调 用 下 一 次 递归 去 跟踪 这 个 入 射 光线 。 第 二 次 递归 将 执行 类 似 的 任务 ， 
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去 查找 它 的 光线 的 源头 。 这 个 过 程 可 能 还 会 递归 调用 。 

有 多 种 终止 递归 光线 跟踪 的 条 件 ， 被 跟踪 的 光线 与 光源 相交 ， 被 跟踪 的 光线 可 能 存在 于 不 
与 物体 相交 的 场景 中 ， 或 者 是 递归 次 数 达到 了 预定 的 限制 。 还 有 男 一 种 终止 条 件 是 基于 表面 的 
吸收 特性 的 ， 如果 表 面 是 高 吸收 性 的 (如 灰暗 不 光滑 的 表面 )， 那 么 任何 入 射 光线 几乎 都 不 会 对 
表面 的 显示 产生 影响 ， 光 线 跟踪 停止 ， 累 积 的 吸收 会 产生 相似 的 效果 。 也 就 是 说 ， 访 问 多 个 适 
度 可 吸收 性 的 表面 后 ， 光 线 跟踪 可 以 终止 。 

正 是 基于 全 局 照明 模式 ， 光 线 跟 踪 才 能 避免 传统 泻 染 流水 线 中 许多 固有 的 限制 。 例 如 ， 隐 
藏 面 的 消除 问题 和 阴影 检测 问题 通常 可 以 在 光线 跟踪 过 程 中 自然 地 解决 。 遗 憾 的 是 ， 光 线 跟 踪 
有 一 个 很 大 的 缺点 ， 那 就 是 费时 。 当 跟踪 每 条 反射 光线 至 其 源 点 时 ， 需 要 的 计算 量 迅 速 增 大 。 
( 当 涉 及 折射 或 者 应 用 分 布 式 光线 跟踪 时 ， 这 个 问题 是 多 方面 的 因此， 光线 跟踪 没有 在 “大 
众 水 平 ” 的 实时 系统 (如 交互 式 视频 游戏 ) 中 实现 ， 但 在 实时 性 要 求 不 高 的 “专业 水 平 ” 的 应 
用 〈 如 电影 工作 室 中 使 用 的 图 像 软件 ) 中 能 找到 它 。 


10.5.2 ”辐射 度 


男 一 种 可 以 取代 传统 演 染 流水 线 的 方法 就 是 辐射 度 (radiosity )。 光 线 跟 踪 通 过 跟踪 单条 光 
线 ， 采 用 点 到 点 的 方法 ; 而 辐射 度 通 过 考虑 两 个 平面 片 对 之 间 的 辐射 光 能 的 总 和 ， 采 取 了 更 加 
区 域 化 的 方法 。 这 个 辐射 的 光 能 本 质 上 就 是 散射 光 。 一 个 物体 辐射 的 光 能 ， 可 能 是 这 个 物体 产 
生 的 (如 光源 这 种 情况 )， 也 可 能 是 这 个 物体 反射 的 。 因 此 每 个 物体 的 显示 都 要 通过 考虑 从 其 他 
物体 接收 的 光 能 来 确定 。 

从 一 个 物体 辐射 的 光 对 另 一 个 物体 显示 的 影响 程度 是 由 称 为 形状 因子 (form factor) 的 参数 
来 确定 的 。 在 场景 中 要 泻 染 的 每 对 面 片 都 关联 唯一 的 形状 因子 。 这 些 形状 因子 考虑 了 两 个 面 片 
之 间 的 几何 关系 ， 比 如 分 开 的 距离 和 相对 朝向 等 因素 。 为 了 确定 场景 中 一 个 面 片 的 显示 ， 需 要 
计算 此 面 片 所 接收 的 来 自 场景 中 其 他 面 片 的 光 能 总 量 , 每 次 计算 都 要 使 用 一 个 合适 的 形状 因子 ， 
然后 将 结果 结合 起 来 ， 产 生 每 个 面 片 的 单个 颜色 和 强度 。 最 后 使 用 类 似 于 Gouraud 着 色 的 技术 ， 
将 这 些 值 插值 到 相 邻 的 面 片 中 间 ， 获 得 光滑 没有 棱角 的 表面 。 

因为 要 考虑 许多 面 片 ， 所 以 辐射 度 的 计算 量 是 很 大 的 。 因 此 ， 与 光线 跟踪 一 样 ， 辐 射 度 的 
应 用 无 法 满足 当前 消费 市 场 上 图 形 系 统 的 实时 要 求 。 辐 射 度 的 另外 一 个 问题 在 于 ， 由 于 它 处 理 
的 单元 包含 整个 面 片 ， 而 不 是 单个 的 点 ， 所 以 它 捕 获 不 到 镜面 反射 光 的 细节 ， 这 就 导致 用 辐射 
度 泻 染 的 所 有 表面 往往 是 灰暗 的 。 

但 是 ， 辐 射 度 的 确 有 它 的 优点 。 首 先 ， 使 用 辐射 度 决定 物体 的 显示 是 不 受 相机 影响 的 。 这 
样 ， 一 旦 计算 出 一 个 场景 的 辐射 度 ， 场 景 不 同 相 机 位 置 的 演 染 就 能 快速 完成 。 其 次 ， 辐 射 度 捕 
获 了 光 的 许多 细微 特征 , 如 渗 色 (color bleeding), 即 一 个 物体 的 颜色 影响 周围 其 他 物体 的 色调 。 
因此 ， 辐 射 度 有 它 的 特定 应 用 。 其 中 之 一 就 是 用 在 建筑 设计 的 图 形 软 件 中 。 实 际 上 ， 建 筑 内 的 
光 主 要 是 由 散射 光 和 环境 光 组 成 ， 镜 面 反 射 光 的 影响 不 大 ， 并 且 新 的 相机 位 置 可 以 得 到 有 效 处 
理 ， 这 一 事实 意味 着 建筑 师 能 很 快 从 不 同 的 视角 看 到 不 同 的 房间 。 


问题 与 练习 


1. 为 什么 光线 跟踪 是 沿 着 光线 向 后 (从 图 像 窗 口 到 光源 ) ， 而 不 是 向 前 《从 光源 到 图 像 窗 口 ) ? 
2. 直接 的 光线 跟踪 和 分 布 式 光线 跟踪 的 区 别 是 什么 ? 

3. 辐射 度 的 两 个 缺点 是 什么 ? | 

4. 光线 跟踪 和 辐射 度 在 哪些 方面 是 相似 的 ? 在 哪些 方面 是 不 同 的 ? 
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10.6 动画 _ 
我 们 现在 转向 计算 机 动画 这 个 课题 ， 它 是 使 用 计算 机 技术 来 生成 和 显示 呈现 运动 的 图 像 。 
10.6.1 动画 基础 
我 们 先 介 绍 一 些 基 本 的 动画 概念 。 
1. 帧 


动画 是 通过 快速 连续 地 显示 称 为 帧 (frame) 的 图 像 序列 获得 的 。 这 些 帧 捕获 了 固定 时 间 间 
隔 内 变化 场景 的 显示 ， 这 样 ， 它 们 的 顺序 展示 就 产生 了 一 直观 看 连续 场景 的 错觉 。 电 影 业 显示 
的 标准 速率 是 每 秒 24 帧 ， 广 播 视频 的 标准 是 每 秒 60 帧 〈 由 于 每 隔 一 帧 的 视频 帧 被 用 来 与 前 一 帧 
混合 ， 以 产生 细节 完整 的 图 像 ， 所 以 视频 也 可 以 被 归 类 为 每 秒 30 帧 的 系统 )。 

帧 可 以 由 传统 的 照片 生成 ， 也 可 以 利用 计算 机 图 形 学 人 工 生成 。 而 且 ， 这 两 种 技术 还 可 以 
结合 应 用 。 例 如 ，2D 图 形 软件 经 常 被 用 来 修改 通过 照片 获得 的 图 像 ， 消 去 支撑 金属 丝 、 营 加 图 
像 、 和 创建 变形 (morphing) 效果 (这 是 一 个 物体 看 起 来 要 转化 成 男 一 个 物体 的 过 程 )。 

让 我 们 一 起 来 深入 研究 变形 ， 它 使 动画 变 得 更 有 趣 。 构 建 变 形 效 果 首 先 要 确定 把 变形 序列 
括 在 一 起 的 一 对 儿 关 键 帧 。 一 个 是 变形 出 现 之 前 的 最 后 一 个 图 像 ， 另 一 个 是 变形 出 现 之 后 的 第 
一 个 图 像 。( 在 传统 的 电影 制作 中 ， 这 需要 “拍摄 ”两 个 动作 序列 : 一 个 是 在 变形 出 现 之 前 ; 另 
一 个 是 在 变形 出 现 之 后 。〉 把 变形 前 与 变形 后 帧 中 的 相似 特征 相关 联 的 点 称 为 控制 点 (control 
point)。 变 形 处 理 是 指 应 用 数学 技术 ,以 控制 点 作为 基准 ,逐渐 把 一 幅 图 像 转 变 为 男 一 幅 图 像 的 
处 理 过 程 。 通 过 记录 变形 过 程 中 所 产生 的 图 像 ， 得 到 一 个 简短 的 人 工 合成 的 图 像 序列 ， 把 它 填 
充 到 当初 定义 的 那 两 个 关键 帧 之 间 ， 就 创建 了 变形 效果 。 





Pm a rg 你 能 制作 
你 自己 的 Kineograph ( 假定 你 还 没有 在 书 的 空白 处 填 满 涂 狗 )、 在 第 一 页 的 空白 处 放置 一 个 国 
点 ， 然 后 在 第 三 页 放置 另 一 个 圆 点 ， 位 置 与 第 一 页 的 稍 有 不 同 。 在 每 个 连续 的 奇数 页 上 重复 
这 个 过 程 ， 直 到 你 到 达 书 的 末尾 处 。 现 在 ， 快 速 翻 动 书页 ， 观 察 点 的 跳动 情况 。 一 转眼 ， 你 
已 经 制作 了 自己 的 Kineograph， 也 许 这 是 你 迈 向 动画 事业 的 第 一 步 。 作 为 运动 学 的 一 个 实验 ， 
你 可 以 试 着 画 粗 线条 人 物 替 代 简 单 的 圆 点 ， 使 得 粗 线条 人 物 看 起 来 像 在 走路 。 现 在 ， 动 力学 
实验 是 通过 产生 水 滴 撞 击 地 面 的 图 像 来 进行 的 


2. 故事 板 

一 个 典型 的 动画 项 目 始 于 故事 板 〈storyboard) 的 创建 ， 故 事 板 是 一 个 二 维 图 像 序列 ， 用 关 
键 点 处 显示 的 场景 草图 的 形式 讲述 一 个 完整 的 故事 。 故 事 板 的 最 终 角 色 取 决 于 动画 项 目 是 用 2D 
技术 实现 的 ， 还 是 用 3D 技 术 实 现 的 。 在 使 用 2D 图 形 的 项 目 中 ， 故 事 板 一 般 会 转变 成 帧 中 的 最 终 
场景 ， 就 像 20 世 纪 20 年 代 迪 士 尼 工 作 室 所 做 的 一 样 。 在 那个 时 候 ， 艺 术 家 〈 称 动画 大 师 ) 把 故 
事 板 细 化 为 称 为 关键 帧 〈key frame) 的 详细 帧 ， 建 立 动画 固定 时 间 间 隔 的 角色 和 场景 的 显示 。 
助理 动画 师 将 绘制 出 填充 两 个 关键 帧 之 间 间 隔 的 另外 的 帧 ， 以 使 动画 看 起 来 连续 而 平滑 。 这 个 
填充 间隔 的 处 理 称 为 中 间 渐 变 (in-betweening )。 

与 以 前 不 同 的 是 ， 现 在 的 动画 制作 人 员 使 用 图 像 处 理 和 2D 图 形 软件 绘制 关键 帧 ， 大 量 的 中 
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间 渐 变 处 理 是 自动 的 ， 所 以 已 经 不 存在 助理 动画 师 这 个 角色 。 

3. 3D 动 画 

大 多 数 视频 游戏 动画 和 功能 完备 的 动画 产品 现在 是 使 用 3D 图 形 创建 的 。 在 这 些 情况 下 ， 项 
目 仍 旧 先 创建 由 三 维 图 像 组 成 的 故事 板 。 但 是 ,与 发 展 成 为 2D 图 像 项 目的 最 终 产品 不 同 ， 故 事 
板 被 用 作 构 建 三 维 虚 拟 世 界 的 蓝图 。 当 其 中 的 物体 按照 脚本 移动 或 在 视频 游戏 中 行进 时 ， 这 个 
虚拟 世界 将 不 断 地 被 “拍摄 ”。 

也 许 我 们 应 该 停 下 来 弄 清楚 物体 在 计算 机 生成 的 场景 内 移动 的 含义 。 记 住 ,“ 物 体 ” 实 际 上 
是 存储 在 场景 图 中 的 数据 集合 。 这 个 集合 中 的 数据 是 一 些 指示 物体 位 置 和 朝向 的 值 。 这样,“ 移 
动 ”一 个 物体 仅 需 通过 改变 这 些 值 就 可 以 完成 。 一 旦 作出 这 些 改变 ， 新 值 就 会 被 用 在 泻 染 处 理 
中 。 从 而 ， 物 体 将 在 最 终 的 二 维 图 像 中 显示 为 已 经 移动 。 





在 传统 的 摄影 领域 人 们 在 生 大 居 如 运动 物体 渍 缚 放 检 沪 而 做 四 大竹 的 拓 力 在 动 
画 领 域 ， 相 反 的 问题 产生 了 。 如 果 描 述 运动 物体 的 序列 帧 中 的 每 一 帧 都 把 物体 渔 染 成 清晰 的 
图 像 ， 那 么 运动 可 能 显示 为 急 动 的 。 然而， 清晰 的 图 像 是 创建 帧 时 的 自然 副产品 ， 因 为 场景 
图 中 的 每 幅 图 像 都 是 静止 的 。 这样， 动画 制作 人 员 经 常 需要 手动 扭曲 计算 机 生成 帧 中 的 运动 
物体 的 图 像 。 有 一 种 技术 称 为 超 取样 (supersampling )， 它 产生 多 幅 图 像 ， 其 中 运动 物体 只 是 
稍微 地 移动 ， 然 后 重 簿 这 些 图 像 生成 单个 帧 。 另 一 种 技术 是 改变 运动 物体 的 形状 ， 使 它 看 起 
来 像 是 沿 着 运动 方向 延伸 的 。 


10.6.2 ”动力 学 和 运动 学 


3D 图 形 场 景 中 的 运动 究竟 是 自动 的 ， 还 是 受 动画 制作 者 控制 的 ， 这 个 自动 化 的 程度 随 应 用 
的 不 同 而 变 得 不 尽 相 同 。 当 然 ， 目 标 是 整个 过 程 的 自动 化 。 为 了 实现 这 个 目标 ， 许 多 研究 已 经 
直接 面向 找寻 能 识别 和 模拟 自然 发 生 现象 的 运动 的 方法 。 机 械 学 中 的 两 个 领域 被 证 明 在 这 一 点 
上 特别 有 用 。 

一 个 是 动力 学 (dynamics)， 它 通过 应 用 物理 定律 确定 力作 用 于 物体 的 效果 ， 来 描述 物体 的 
运动 。 例 如 ， 除 了 位 置 外 ， 场 景 中 的 物体 可 能 被 赋予 运动 的 方向 、 速 度 和 质量 。 然 后 使 用 这 些 
数据 来 确定 重力 或 与 其 他 物体 的 碰撞 对 物体 产生 的 影响 ， 为 软件 计算 下 一 帧 中 物体 的 合理 位 置 
提供 依据 。 

考虑 创建 一 个 描述 容器 中 水 的 晃动 的 动画 序列 。 我 们 可 以 使 用 场景 图 中 的 粒子 系统 来 表示 水 ， 
TA Ra eet et et 

一 边 时 ， 我 们 可 以 应 用 物理 定律 计算 粒子 重力 的 影响 ， 以 及 粒子 间 的 相互 作用 。 这 样 可 以 计算 出 
ed nite, 通过 使 用 外 层 粒 子 的 位 置 作为 多 边 形 网 格 的 顶点 ， 我们 能 够 获得 
描述 水 表面 的 网 格 。 在 模拟 过 程 中 ， 通 过 不 断 地 “拍摄 ”这 些 网 格 ， 就 得 到 了 动画 。 

用 来 模拟 运动 的 另 一 个 机 械 学 分 文 是 运动 学 (kinematics)， 它 根据 物体 各 部 分 间 的 相对 运 
动 方式 ， 来 描述 物体 的 运动 。 当 模拟 有 关节 的 角色 时 ， 运 动 学 应 用 的 优势 就 特别 显著 ， 因 为 这 
需要 移动 像 手 臂 和 腿 之 类 的 附属 物 。 与 计算 肌肉 和 重力 施加 的 力 的 影响 相 比 ， 模 拟 关节 运动 模 
式 更 容易 对 运动 进行 建 模 。 因 此 ， 当 确定 弹 球 的 路 径 时 ， 动 力学 可 能 是 可 选 的 技术 ; 而 模拟 人 
物 手臂 的 运动 将 使 用 运动 学 计算 出 合理 的 肩膀 、 肘 和 手腕 的 旋转 度 。 因 此 ， 许 多 模拟 生物 特性 
的 研究 集中 在 解剖 学 的 问题 上 一 一 关节 与 附属 物 的 结构 是 如 何 影 响 运动 的 。 
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应 用 运动 学 的 一 个 典型 范例 是 : 首先 用 粗 线条 人 物 图 来 表示 人 物 ， 模 拟 被 描述 的 人 物 的 骨 
骼 结构 ; 然后 用 多 边 形 网 格 覆 盖 人 物 的 每 个 部 分 ， 表 示 围 绕 这 个 部 分 的 人 物 表面 ， 并 且 建 立 相 
应 的 规则 ， 确 定 相 邻 的 网 格 相互 连接 的 方式 。 通 过 重新 定位 关节 在 骨骼 结构 中 的 位 置 ， 就 能 
操纵 人 物 (通过 软件 或 动画 制作 者 来 操纵 )， 就 像 一 个 人 操纵 提 线 木偶 时 使 用 的 方式 一 样 。“ 线 ” 
连接 到 模型 的 点 称 为 关节 变量 (avars)， 它 是 “articulation variables”( 或 最 近 提 出 的 “animation 
variables”) 的 简写 。 

许多 运动 学 应 用 的 研究 已 经 朝 着 开发 算法 的 方向 发 展 ， 以 自动 计算 模拟 自然 发 生 运动 的 附 
属 物 位置 的 序列 。 沿 着 这 些 方向 ， 生 成 逼真 的 行走 序列 的 算法 现在 已 经 产生 了 。 

但 是 ， 基 于 运动 学 的 大 量 动画 还 是 通过 指示 人 物 穿 过 关节 一 附着 物 位 置 的 预 设 序列 而 产生 
的 。 这 些 位 置 可 能 是 由 动画 制作 者 创造 性 地 给 出 的 ， 也 可 能 是 由 运动 捕捉 (motion capture) 获 
得 的 ， 运 动 捕捉 记录 了 生物 模型 在 执行 相应 的 动作 时 的 位 置 。 更 准确 地 说 ， 在 人 身体 上 的 主要 
关节 应 用 反光 带 后， 就 可 以 从 多 个 角度 拍摄 人 投掷 棒球 的 动作 。 然 后 ， 通 过 观察 各 种 照片 中 反 
光 带 的 位 置 ， 就 可 以 标识 出 人 在 进行 投掷 动作 时 手臂 和 腿 的 精确 位 置 ， 并 将 这 些 位 置 传送 给 动 
画 中 的 人 物 。 


10.6.3 动画 制作 过 程 


动画 研究 的 最 终 目标 是 自动 化 整个 动画 制作 过 程 。 想 象 一 下 软件 〈 给 定 合理 的 参数 ) 能 自 
动 生成 所 需 的 动画 序列 。 当 今 ， 影 视 公司 通 过 单个 虚拟 “机 器 人 ”生成 了 人 群 图 像 、 战 争 场景 
和 惊 逃 的 动物 ， 这 些 “ 机 器 人 ”在 场景 中 自动 移动 ， 每 个 都 执行 分 配给 它 的 任务 ， 这 充分 印证 
了 人 类 在 动画 制作 领域 中 取得 的 进步 。 

当 拍摄 《 指 环 王 》 三 部 曲 中 约 想 的 半 兽 人 军队 和 人 类 军队 时 ， 有 趣 的 情况 发 生 了 。 每 一 
屏幕 上 的 战士 都 被 建 模 成 不 同 的 “智能 ”物体 ， 它 们 具有 自己 的 体型 特征 和 随机 赋予 的 个 性 ， 
这 种 个 性 赋予 它 一 个 攻击 或 是 逃跑 的 倾向 。 在 第 二 部 圣 盔 谷 战争 的 模拟 测试 中 ， 半 兽人 的 逃跑 
倾向 设置 得 过 高 ， 当 它们 刚 遇 到 人 类 战士 时 ， 就 逃跑 了 。( 这 也 许 是 虚拟 群众 演员 认为 工作 太 和 危 
险 的 第 一 个 实例 。) 

当然 ， 如 今 许多 动画 还 是 由 人 类 动画 制作 者 来 制作 的 。 但 是 ， 不 同 于 20 世 纪 20 年 代 的 手工 
绘制 二 维 帧 ， 如 今 这 些 动画 制作 者 都 使 用 软件 操纵 场景 图 中 的 三 维 虚拟 物体 ， 这 种 方式 让 人 想 
起 前 面 讨论 运动 学 时 介绍 的 控制 提 线 木偶 的 方式 。 用 这 种 方式 ， 一 位 动画 制作 者 能 够 创建 一 系 
列 的 虚拟 场景 ， 这 些 场景 然后 被 “拍摄 ”成 动画 。 在 某 些 情况 下 ， 人 们 使 用 这 种 技术 来 产生 关 
键 帧 的 场景 ， 然 后 当 软 件 应 用 动力 学 和 运动 学 把 场景 图 中 物体 从 一 个 关键 帧 场景 位 置 移 到 下 一 
个 关键 帧 场景 位 置 时 ， 再 使 用 软件 通过 自动 泻 染 场景 来 产生 中 间 渐 变 帧 。 

随 着 计算 机 图 形 学 的 进步 以 及 技术 的 不 断 提高 ， 肯 定 会 有 更 多 的 动画 制作 过 程 变 成 自动 化 
的 。 是 否 有 一 天 动画 制作 者 这 一 角色 将 不 复 存 在 ， 人 类 演员 和 物理 布景 也 将 成 为 过 去 ， 针 对 这 
一 点 尚 无 定论 ， 但 许多 人 都 认为 这 一 天 不 再 遥远 。 实 际 上 ， 与 把 无 声 电影 转化 为 有 声 电影 相 比 ， 
3D 图 形 学 对 影视 产业 的 影响 可 能 更 为 深远 。 


问题 与 练习 
1. 人 类 看 见 的 图 像 往 往 在 人 类 的 感知 上 约 有 200 毫 秒 的 视觉 暂 留 ， 基 于 这 个 近似 值 ， 每 秒 必须 旦 现 多 少 
a 才能 产生 动画 ? 这 个 近似 值 是 如 何 对 应 于 电影 中 使 用 的 每 秒 的 帧 数 的 ? 






. 什么 是 中 间 渐变 ? 
4. 定义 术语 运动 学 和 动力 学 。 
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. 下 列 哪个 是 2D 图 形 学 的 应 用 ， 哪 个 是 3D 图 形 


学 的 应 用 ? 

a. 设计 杂志 页 面 的 布局 。 

b. 用 微软 画图 软件 绘制 图 像 。 

c. 为 视频 游戏 生成 虚拟 世界 的 图 像 。 


. 3D 图 形 学 中 的 哪些 术语 对 应 于 下 列传 统 摄影 


领域 的 术语 ? 解释 你 的 答案 。 

a. 胶卷 。 

b. 取景 器 中 的 矩形 。 

c. 被 拍摄 的 场景 。 

当 使 用 透视 投影 时 ,场景 中 的 球 在 什么 条 件 下 
不 会 在 投影 平面 上 产生 一 个 圆圈 ? 


. 当 使 用 透视 投影 时 , 直线 段 的 图 像 能 变 成 投影 


平面 上 的 曲线 段 吗 ? 证 明 你 的 答案 。 


. 假设 8 英尺 直 柱 的 一 端 距离 投影 中 心 4 英尺 ， 


而 且 假设 从 投影 中 心 到 直 柱 一 端的 直线 与 投 
影 平 面相 交 于 一 点 ， 这 一 点 距离 投影 中 心 1 英 
尺 ， 如 果 柱 体 与 投影 平面 平行 , 那么 在 投影 平 
面 里 柱子 的 图 像 长 度 是 多 少 ? 

说 明 平行 投影 和 透视 投影 之 间 的 区 别 。 


. 说 明 图 像 窗口 和 帧 缓冲 区 之 间 的 关系 。 
. 应 用 3D 图 形 学 产生 电影 和 应 用 3D 图 形 学 产生 


交互 式 视频 游戏 的 动画 , 二 者 之 间 有 什么 明显 
的 不 同 ? 请 解释 你 的 答案 。 

说 出 物体 的 一 些 特 性 ， 这 些 特性 可 能 出 现在 
3D 图 形 场 景 使 用 的 这 个 物体 的 模型 中 ， 说 出 
可 能 不 会 出 现在 模型 中 的 一 些 特性 , 并 解释 你 
的 答案 。 


. 说 出 一 些 示 被 只 含 多 边 形 网 格 模型 捕获 的 物 


体 的 物理 特性 。( 因 此 , 单独 的 多 边 形 网 格 并 
不 能 构建 一 个 完整 的 物体 模型 。) 解释 如 何 把 
这 些 物理 特性 中 的 一 个 添加 到 物体 模型 中 。 


. 三 维 空间 中 的 任意 4 个 点 能 是 多 边 形 网 格 中 的 


面 片 的 顶点 吗 ? 解释 你 的 答案 。 


. 下 面 的 每 个 集合 都 表示 了 多 边 形 网 格 中 一 个 


面 片 的 顶点 《使 用 传统 的 直角 坐标 系 ) ,描述 
网 格 的 形状 。 
面 片 1: (0,0,0) (0,2,0) (2,2,0) 
(2,0,0) 
面 片 2: (0,0,0) (1,1,1) (2,0,0) 


@ 1 英尺 =0.3048 米 。 一 一 编者 注 


16. 


18. 
. 在 建 模 过程 和 演 染 过 程 之 间 ， 哪 一 个 是 更 
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面 片 3: (2, 0, 0) (1, 1, 1) (2, 2, 0) 
面 片 4: (2, 2, 0) (1, 1, 1) (0, 2, 0) 
面 斤 5: (0; 2,.0) (1, .1,1)(05070) 


. 下 面 的 每 个 集合 都 表示 了 多 边 形 网 格 中 一 个 


面 片 的 顶点 《使 用 传统 的 直角 坐标 系 ) ， 描 述 
网 格 的 形状 。 

面 片 1: (0, 0, 0) (0, 4, 0) (2, 4, 0) 

(2, 0, 0) 

(0, 0, 0) (0, 4, 0) (1, 4, 1) 

(1,0, 1) 

(2, 0, 0) (1, 0, 1) (1, 4, 1) 

(2, 4, 0) 

(0, 0, 0) (1, 0, 1) (2, 0, 0) 

(2, 4, 0) (1, 4, 1) (0, 4, 0) 


面 片 2: 


面 片 3: 


面 片 4: 
面 片 5: 


. 设计 表示 长 方 体 的 多 边 形 网 格 , 使 用 传统 的 直 


角 坐 标 系 来 表示 项 点, 绘制 出 一 幅 草 图 表示 你 
的 解决 方案 。 


. 使 用 不 超过 8 个 三 角 面 片 ， 设 计 一 个 多 边 形 网 


格 ， 近 似 表示 半径 为 1 的 球 的 形状 。 (只 有 8 
个 面 片 ， 你 的 网 格 将 是 非常 粗糙 的 近似 球形 ， 
但 目的 是 帮助 你 理解 什么 是 多 边 形 网 格 , 而 不 
是 产生 球 的 精确 表示 。) 使 用 传统 的 直角 坐标 
系 表示 面 片 的 顶点 ， 绘 制 出 网 格 的 草图 。 
为 什么 下 面 4 个 点 不 是 平面 片 的 项 点 ? 

(0, 0, 0) (1, 0, 0) 

(0, 1, 0) (0, 0, 1) 


. 假设 顶点 (1, 0, 0)、(1 1, 1) 和 (1, 0, 2) 是 平面 


片 的 顶点 , 下面 哪 个 线段 是 面 片 表面 的 法 线 ? 
a， 从 (1, 0, 0) 到 (1, 1, 0) 的 线段 

b. 从 (1, 1, 1) 到 (2, 1, 1) 的 线段 

c. 从 (1, 0, 2) 到 (0, 0, 2) 的 线段 

d. 从 (1, 0, 0) 到 (1, 1, 1) 的 线段 

说 出 程序 化 模型 的 两 种 “类 型 ”。 


a. 标准 化 的 任务 ? 

b. 密集 型 的 计算 任务 ? 

c. 具 创 造 性 的 任务 ? 

证 明 你 的 答案 。 

下 列 哪 一 个 可 能 在 场景 图 中 表示 ? 
a. 光源 

b. 不 动 的 道具 

c. 人 物 /演员 
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d. 照相 机 

在 何 种 意义 上 说 ， 场 景 图 的 创建 是 3D 图 形 学 
处 理 的 关键 步骤 ? 

场景 图 中 的 照相 机 可 能 会 改变 位 置 和 朝向 , 这 
个 事实 引入 了 何 种 复杂 性 ? 

假设 带 有 顶点 (0, 0,0) 、 (0,2,0) 、 (2, 2， 
0) 和 (2, 0, 0) 的 平面 片 的 表面 是 平滑 且 有 光 
泽 的 。 如 果 一 条 从 点 〈0, 0, 1) 发 出 的 光线 ， 
在 (1, 1,0) 处 入 射 表面 ， 反 射 光 将 经 过 下 列 
哪个 点 ? 

a. (0, 0, 1) 

bE 

c. (2, 2, 1) 

d. (3, 3, 1) 

假设 一 个 浮标 上 支撑 着 一 个 离 静 止 水 面 高 10 
英尺 的 灯 ， 如 果 有 一 个 观察 者 离 浮标 15 英 尺 ， 
离 水 面 高 5 英尺 ， 那 么 观察 者 在 水 面 的 哪个 点 
上 能 看 到 灯 的 反射 ? 

如 果 一 条 鱼 在 静止 水 面 下 游 动 , 观察 者 从 水 面 上 
看 鱼 ， 从 观察 者 的 位 置 来 看 ， 鱼 似乎 是 在 哪里 ? 
a. 在 它 的 真实 位 置 的 上 方 且 朝 向 背景 方向 。 
b. 在 真实 的 位 置 。 

c. 在 它 的 真实 位 置 的 下 方 且 朝向 前 景 方向 。 
假设 点 (1,0;0》、 《1,1;1) 和 《1 0 27 
是 平面 片 的 顶点 , 并 且 从 物体 外 面 观看 时 项 
点 是 以 道 时 针 顺 序 依次 排列 。 在 以 下 每 种 情 
况 下 , 指明 从 所 给 出 的 点 发 出 的 光线 是 从 物 
体 的 外 面 照 到 面 片 的 表面 的 , 还 是 从 物体 的 
里 面 照 到 面 片 的 表面 的 。 

a. (0, 0, 0) 

b. (2, 0, 0) 

6 (2, 1 1) 

dS 1) 


. 举 一 个 例子 ,说 明 视 体外 的 物体 能 够 出 现在 最 


终 图 像 中 ， 并 解释 你 的 答案 。 
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描述 z 缓 冲 区 的 内 容 和 用 途 。 

在 针对 隐藏 面 消除 的 讨论 中 ， 借 助 z 缓 冲 区 我 
们 描述 了 解决 “前 景 /背景 ”问题 的 过 程 。 用 
第 5 章 介 绍 的 伪 代 码 表示 这 个 过 程 。 

假设 物体 的 表面 被 交替 的 检 色 和 蓝 色 竖 条 
纹 覆 盖 , 每 一 个 条 纹 的 宽度 都 是 1 厘米。 如果 
将 这 个 物体 放置 在 场景 中 ， 使 其 像素 位 置 与 
物体 上 间隔 2 cm 的 点 相关 联 , 那么 在 最 终 图 像 
中 , 物体 的 可 能 显示 是 什么 ? 解释 你 的 答案 。 
虽然 纹理 映射 和 四 凸 映 射 都 是 与 表面 “纹理 ” 
相关 的 方法 ,但 它们 是 相当 不 同 的 技术 , 用 一 
小 段 话 来 对 它们 进行 比较 。 

列 出 泻 染 流水 线 的 4 个 步骤 , 并 给 出 简要 说 明 。 
使 用 硬件 /固件 实现 泻 染 流水 线 有 哪些 优点 ? 
为 交互 式 视频 游戏 设计 的 计算 机 的 硬件 与 通 
用 PC 的 硬件 在 哪些 方面 不 同 ? 

传统 泻 染 流水 线 的 主要 限制 是 什么 ? 

局 部 照明 模式 与 全 局 照明 模式 之 间 的 区 别 是 
什么 ? 

光线 跟踪 与 传统 的 泻 染 流水 线 相 比 有 哪些 优 
点 ， 有 哪些 缺点 ? 

分 布 式 光线 跟踪 与 传统 的 光线 跟踪 相 比 有 哪 
些 优点 ， 有 哪些 缺点 ? 

辐射 度 与 传统 的 泻 染 流 水 线 相 比 有 哪些 优点 ， 
有 哪些 缺点 ? 

用 传统 光线 跟踪 生成 的 场景 图 像 ， 与 用 辐射 
度 生成 的 相同 场景 的 类 似 图 像 相 比 较 ， 有 何 
异同 ? 

电影 院 放映 的 90 分 钟 动画 产品 需要 多 少 帧 ? 
描述 粒子 系统 是 如 何 被 用 来 产生 火苗 闪烁 的 
动画 的 。 

当 创建 一 个 描述 单个 物体 在 场景 中 移动 的 动 
画 序列 时 ， 解 释 z 缓 冲 区 的 使 用 有 何 帮助 。 
当今 的 人 类 动画 制作 者 与 以 前 的 人 类 动画 制 
作者 的 工作 有 哪些 不 同 ? 


aa xc 一 eccapaeoaTe 一 人 are 





希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 道德 、 社 会 和 法 律 问题 。 回 答 出 这 

以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

1. 假设 计算 机 动画 达到 了 在 影视 行业 中 不 再 需要 真实 演员 的 地 步 ， 那 结果 将 是 什么 ? 不 再 
有 “电影 明星 ”会 带 来 什么 样 的 连锁 反应 ? 

2. 随 着 数码 照相 机 和 相关 软件 的 发 展 ， 大 众 已 经 具备 了 改变 或 制作 照片 的 能 力 。 这 将 给 社 


些 问 题 还 不 够 ， 还 应 该 考虑 为 什么 这 样 回答 ， 
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会 带 来 何 种 变化 ? 会 引起 哪些 道德 和 法 律 问题 ? 

3. 照片 所 有 权 的 程度 是 什么 ? 假设 一 个 人 在 网 站 上 放置 了 他 的 照片 ， 其 他 人 下 载 这 张 照 
片 ， 修 改 它 ， 以 至 主体 受 损 ， 并 且 传 播 修改 后 的 版 本 。 那 么 照片 的 主体 应 该 拥有 什么 追 
索 权 ? 

4. 帮助 开发 暴力 视频 游戏 的 程序 员 应 该 对 此 游戏 产生 的 任何 后 果 负 有 何 种 程度 的 责任 ? 
是 否 应 该 限制 儿童 接触 此 类 游戏 ? 如 果 是 的 话 , 应 如 何 限 制 以 及 由 谁 来 限制 ? 对 社会 上 
其 他 一 些 特殊 的 团体 (如 罪犯 );， 应 该 采取 何 种 限制 ? 
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人 工 智 能 


章 探讨 计算 机 科学 的 一 个 分 支 : 人 工 智能 。 尽 管 该 领域 相对 年 轻 ， 但 它 已 经 产生 了 

一 些 令 人 惊讶 的 结果 ， 例 如 ， 电 子 游戏 节目 的 参赛 者 ， 用 来 学 习 和 推理 的 计算 机 ， 
协调 一 致 来 完成 一 个 共同 的 目标 (如 赢得 一 场 足 球 比赛 ) 的 多 个 机 器 。 在 人 工 智能 领域 ,今天 
的 科学 幻想 很 可 能 是 明天 的 现实 。 


本 章 内 容 

11 徊 能 与 移 颖 11.5 人工 神经 网 络 
112 戌 知 We 
全 


“11.4 其 他 研究 领域 


人 工 智 能 是 计算 机 科学 的 一 个 领域 ， 旨 在 设法 建造 自主 的 机 器 一 无需 人 为 干预 就 能 完成 
复杂 任务 的 机 器 。 这 个 目标 要 求 机 器 能 够 感知 和 推理 ， 这 两 种 能 力 属 于 一 般 意义 上 的 活动 ， 虽 
然 对 于 人 脑 来 说 是 自然 而 然 的 ， 但 历史 证 明 对 于 机 器 来 说 是 有 难度 的 。 结 果 是 该 领域 的 工作 一 
直 富 于 挑战 性 。 本 章 就 来 探讨 这 个 广阔 研究 领域 中 的 一 些 主题 。 


CT TT TT TT TT 


人 工 智 能 领域 相当 大 ， 并 且 是 与 像 心理 学 、 神 经 学 、 数 学 、 语 言 学 以 及 机 电工 程 等 其 他 学 
科 相 融合 的 。 为 了 集中 思路 , 我 们 先 来 考虑 智能 体 的 概念 以 及 智能 体 可 能 呈现 的 智能 行为 类 型 。 
实际 上 ， 人 工 智能 的 许多 研究 都 可 按 智 能 体 的 行为 来 分 类 。 


11.1.1 智能 体 


智能 体 〈agent) 是 一 种 能 对 其 环境 的 刺激 做 出 响应 的 “装置 " 人 们 会 很 自然 地 把 一 个 智 
能 体 想象 为 一 个 像 机 器 人 一 样 的 单个 机 器 ， 尽 管 它 可 以 有 别 的 形式 ， 如 自动 飞机 、 交 互 式 视频 
游戏 里 的 角色 ， 或 是 通过 因特网 与 其 他 进程 通信 的 进程 (可 能 作为 客户 机 、 服 务 器 或 对 等 机 )。 
大 多 数 智能 体 都 具有 传感器 和 效应 器 ， 前 者 接收 来 自 其 环境 的 数据 ， 后 者 对 其 环境 做 出 反应 。 
常见 的 传感器 包括 麦克 风 、 摄 像 机 、 距 离 传感器 以 及 空气 或 土壤 采样 设备 等 ， 效 应 器 的 例子 有 
车 轮 、 腿 、 翅 膀 、 夹 子 以 及 语音 合成 器 。 

很 多 人 工 智能 的 研究 可 以 在 构建 智能 体 的 环境 中 进行 描述 ， 这 意味 着 智能 体 效 应 器 的 动作 
必须 对 通过 其 传感器 接收 的 数据 做 出 合理 的 响应 。 按 照 响 应 的 级 别 ， 我 们 可 以 对 这 些 研究 进 
行 分 类 。 

最 简单 的 响应 是 映射 行为 ， 这 只 是 对 输入 数据 的 一 个 预定 的 响应 。 更 高 级 的 响应 用 于 获取 





11.1 智能 与 机 器 345 


更 “智能 的 ”行为 。 例 如 ， 我 们 可 以 赋予 智能 体 以 环境 知识 ， 要 求 其 相应 地 调整 其 行为 。 投 掷 
棒球 的 过 程 在 很 大 程度 上 是 映射 行为 ， 但 决定 怎样 扔 ， 向 哪个 方向 扔 ， 就 需要 对 当前 环境 有 一 
定 的 了 解 。( 如 此 时 一 个 人 出 局 ， 跑 手 在 一 又 和 三 垒 。) 怎么 样 存 储 、 更 新 和 获取 这 种 现实 世界 
的 知识 ， 然 后 最 终 应 用 到 决策 过 程 中 ， 一 直 是 人 工 智能 领域 具有 挑战 性 的 问题 。 

如 果 我 们 希望 智能 体 的 目标 是 赢得 一 场 棋 赛 或 是 通过 一 条 拥挤 的 通道 ， 那 么 就 需要 另 一 种 
层次 的 响应 。 这 种 有 目标 性 的 行为 需要 智能 体 的 响应 (或 是 一 系列 的 响应 )， 应 当 是 周密 考虑 的 
结果 ， 构 成 一 个 行为 计划 ， 或 是 在 当前 的 各 种 选项 中 选取 最 好 的 行为 。 

在 有 些 情 况 下 ， 智 能 体 的 响应 能 够 随 着 智能 体 的 不 断 学 习 而 得 到 改进 。 智 能 体 的 学 习 可 以 
采取 不 断 发 展 过 程 性 知识 (procedural knowledge〉 的 形式 (学 习 “ 怎 样 ”)， 或 者 储备 陈述 性 知 
识 (declarative knowledge) 的 形式 学习“ 什么 ”)。 学 习 过 程 性 知识 涉及 一 个 反复 试验 的 过 程 ， 
在 这 个 过 程 中 ， 智 能 体 从 出 错 受 罚 、 正 确 受 奖 的 过 程 中 学 习 适 当 的 反应 。 人 们 根据 这 个 方法 开 
发 了 一 些 智 能 体 ， 它 们 能 够 随 着 时 间 的 推移 逐步 提高 在 西洋 跳棋 和 国际 象棋 等 竞赛 性 游戏 中 的 
能 力 。 学 习 陈 述 性 知识 通常 采取 的 形式 是 扩充 或 变更 智能 体 的 知识 库 里 的 “事实 ” 例如 ， 一 个 
棒球 运动 员 必须 不 断 地 重复 调整 其 知识 数据 库 〈 虽 然 还 是 一 人 出 局 ， 但 现在 跑 垒 手 在 第 一 又 和 
第 二 人 垒 )， 从 中 对 将 来 的 事件 做 出 合理 响应 。 

一 个 智能 体 要 对 刺激 做 出 合理 的 响应 ， 就 必须 “理解 ”由 其 传感器 接收 的 刺激 。 也 就 是 说 ， 
智能 体 必须 能 够 从 其 传感器 产生 的 数据 里 提取 信息 ， 或 者 换 句 话说 ， 智 能 体 必须 能 够 感知 。 在 有 
些 情况 下 ， 这 是 一 个 简单 的 过 程 。 从 一 个 陀螺 仪 获取 的 信和 号 很 容易 就 能 编码 成 适合 计算 的 形式 ， 
以 确定 响应 。 但 是 有 些 情 况 下 ， 从 输入 数据 提取 信息 并 不 容易 ， 例 如 ， 理 解 语 音 和 理解 图 像 就 很 
难 。 同 样 ， 智 能 体 也 必须 能 够 以 与 效应 器 兼容 的 方式 表达 它们 的 啊 应 。 这 可 以 是 一 个 简单 的 过 程 ， 
也 可 能 要 求 智能 体 把 其 响应 表达 为 一 个 完整 的 口语 句子 一 一 这 意味 着 智能 体 必 须 生 成 语音 。 所 
以 ， 像 图 像 处 理 和 分 析 、 自 然 语言 理解 以 及 语音 的 生成 这 些 主题 都 是 重要 的 研究 领域 。 

我 们 这 里 标识 的 智能 体 的 属性 既 表 示 以 前 的 研究 范畴 ， 
又 表示 当今 的 研究 范畴 。 当 然 ， 它 们 彼此 之 间 并 不 是 完全 无 
关 的 。 我 们 希望 最 终 能 够 开发 出 处 理 所 有 这 些 属 性 的 智能 体 ， 
产生 出 能 够 理解 来 自 环境 的 数据 ， 并 通过 学 习 过 程 开 发 新 的 
响应 模式 的 智能 体 ， 学 习 的 目的 是 最 大 限度 地 提高 智能 体 的 人 
能 力 。 然 而 ， 通 过 孤立 各 类 推理 行为 并 独立 研究 它们 ， 研 究 “ 图 11-1 八 数码 游戏 的 最 终 布局 
人 员 获 得 了 一 个 立足 点 ， 由 此 入 手 ， 可 以 与 其 他 领域 的 发 展 
相 结合 ， 产 生 更 加 智能 的 智能 体 。 

本 节 的 最 后 我 们 介绍 一 个 智能 体 ， 为 11.2 节 和 11.3 节 的 讨 
论 提供 一 个 背景 。 该 智能 体 是 为 解决 八 数码 游戏 (eight-puzzle) 
而 设计 的 ， 该 游戏 由 8 个 小 方块 组 成 ， 标 号 为 1 一 8， 放 置 在 一 
个 3 行 3 列 总 共 可 容纳 9 个 小 方块 的 框架 内 ( 见 图 11-1)。 这 样 ， 
框 内 的 方块 间 有 个 空位 ， 挨 着 空位 的 方块 可 以 移动 ， 人 允许 框 
内 的 方块 随意 排 布 。 问 题 是 要 把 杂乱 排 布 的 方块 移 回 到 它们 
的 初始 位 置 ( 见 图 11-1)。 

我 们 的 智能 体 采 用 的 装置 配 有 一 个 夹具 、 一 个 摄像 机 和 
一 个 带 橡 皮 头 的 指 杆 ， 其 中 橡皮 是 为 了 推移 东西 时 不 会 打滑 < 
〈 见 图 11-2)。 当 首次 开启 该 智能 体 时 ， 夹 具 会 一 张 一 合 ， 图 11-2 ”我们 的 八 数码 游戏 求解 机 器 
像 它 在 索要 拼图 一 样 。 当 我 们 把 一 个 随意 排 布 的 八 数码 游戏 
拼图 放 进 夹具 时 ， 夹具 就 会 接近 它 。 不 一 会 儿 ， 机 器 的 指 杆 会 降低 ， 并 开始 在 框架 内 推移 方块 ， 








346 第 11 村 人 工 尖 能 


直到 所 有 的 方块 恢复 到 它们 的 原始 位 置 。 这 时 ， 机 器 会 放 开 拼 板 并 自己 关 掉 电源 。 

这 个 解决 八 数码 游戏 的 机 器 展现 了 前 面 提 到 过 的 两 个 智能 体 的 属性 。 第 一 ， 它 必须 能 够 感 
知 ， 就 是 必须 从 其 摄像 机 拍摄 的 图 像 中 获取 当前 拼图 的 状态 。 我 们 将 在 11.2 节 阐述 理解 图 像 的 
问题 。 第 二 ， 它 必须 开发 和 实现 一 个 达到 目标 的 计划 。 这 些 问题 将 在 11.3 节 中 阐述 。 


11.1.2 ”研究 方法 


要 对 人 工 智 能 领域 作出 客观 的 评价 ， 应 该 知道 对 该 领域 的 研究 存在 两 种 路 线 。 一 种 可 以 称 
为 工程 线路 ， 即 研究 人 员 侧 重 于 开发 展示 智能 行为 的 系统 。 男 一 种 可 以 称 为 理论 路 线 ， 即 研究 
人 员 会 尝试 从 计算 的 角度 来 研究 动物 (尤其 是 人 类 ) 的 智能 。 我 们 通过 考虑 这 两 种 路 线 的 执行 
方式 ， 来 说 明 这 种 二 分 的 研究 方法 。 在 工程 路 线 指导 下 ， 由 于 潜在 目标 是 生产 出 符合 某 些 性 能 
目标 的 产品 ， 因 此 就 产生 了 面向 性 能 的 方法 论 。 在 理论 路 线 指导 下 ， 由 于 潜在 目标 是 增进 人 类 对 
计算 智能 的 理解 ， 所 以 关注 重点 是 底层 处 理 而 非 外 在 性 能 ， 因 此 就 产生 了 面向 模拟 的 方法 论 。 

作为 一 个 例子 ， 考 虑 自然 语言 处 理 和 语言 学 领域 。 这 些 领域 关系 密切 ， 各 领域 的 研究 可 互 
相 取 长 补 短 ， 但 它们 的 根本 目标 却 不 同 。 语 言 学 家 的 兴趣 在 于 弄 明白 人 类 如 何 处 理 语言 ， 因 此 
更 倾向 于 理论 性 的 研究 ， 而 自然 语言 处 理 领域 的 研究 者 的 兴趣 在 于 开发 能 处 理 自 然 语言 的 机 
器 。 所 以 ， 语 言 学 家 以 面向 模拟 的 模式 运作 ， 也 就 是 建造 用 来 检验 理论 的 系统 。 相 反 ， 自 然 
语言 处 理 的 研究 者 以 面向 性 能 的 模式 构建 系统 执行 任务 。 后 一 种 模式 产生 的 系统 〈 如 文档 翻译 
机 和 响应 口头 命令 的 机 器 系统 ) 在 很 大 程度 上 依赖 于 语言 学 家 获取 的 知识 ， 但 在 特定 系统 的 限 
定 环境 中 经 常 使 用 可 以 工作 的 “简化 方法 ” 

作为 一 个 基本 的 例子 ， 考 虑 为 一 个 操作 系统 开发 一 个 外 壳 《〈shell) 的 任务 ， 它 通过 口述 英 
语 命令 接收 来 自 外 部 世界 的 指令 。 在 这 种 情况 下 ，shell (一 个 智能 体 ) 不 需要 考虑 完整 的 英语 
语言 。 更 准确 地 说 ， 外 过 不 需要 区 分 copy 这 个 词 的 不 同意 思 。( 是 名 词 还 是 动词 ?是 否 有 抄 胡 的 
含义 ? ) 相反 ， 外 壳 仅仅 需要 把 copy 这 个 词 与 其 他 命令 (如 rename、delete〉 区 分 开 来 ， 所 以 外 
壳 可 以 通过 将 输入 与 预先 确定 的 音频 模式 相 匹配 来 完成 任务 。 这 种 系统 的 性 能 可 能 会 令 工程 师 
满意 ， 但 从 美学 角度 看 ， 其 实现 方式 也 许 并 不 能 取悦 理论 家 。 


11.1.3 ”图 灵 测 试 


过 去 ， 图 灵 测 试 〈Turing test，1950 年 由 阿兰 。 图 灵 提 出 ) 一 直 作 为 衡量 人 工 智 能 领域 发 展 
的 一 种 标准 。 现 在 ， 图 灵 测 试 的 重要 性 已 不 及 从 前 ， 但 它 仍 是 人 工 智 能 领域 重要 的 一 部 分 。 图 
灵 的 提议 是 ， 允 许 一 个 人 (我 们 称 他 为 询问 者 ) 与 一 个 测试 对 象 通过 一 个 打字 机 系统 进行 通信 ， 
而 没有 告知 询问 者 测试 对 象 究竟 是 一 个 人 还 是 一 台 机 器 。 在 这 种 环境 中 ， 如 果 询 问 者 没 能 够 把 
一 台 机 器 与 一 个 人 区 分 开 来 ， 那 么 可 以 说 明 这 台 机 器 的 行为 是 智能 的 。 图 灵 预 测 ， 到 2000 年 ， 
机 器 将 会 有 30% 的 机 会 通过 一 个 5 分 钟 的 图 灵 测 试 一 一 这 个 预见 惊人 地 准确 ! 










WY AA Ee cud a "i 
寻求 建造 能 够 模仿 人 类 行为 的 机 器 有 很 长 的 历史 , 不 过 很 多 人 会 认同 现代 人 工 智能 领域 起 源 
于 1950 年 。 就 在 这 一 年 ， 阿 兰 。 图 灵 发 表 了 论文 “Computing Machinery and Intelligence”， 提 出 机 
器 能 够 通过 编程 来 展现 智能 的 行为 。 这 个 领域 的 名 字 一 一 人 工 智能 一 一 就 在 几 年 后 由 约翰 。 去 
卡 锡 (John McCarthy ) 在 一 个 现在 看 来 颇具 传奇 色彩 的 建议 里 提出 ， 他 建议 “1956 年 夏天 在 达 
特 茅 斯 学 院 (Dartmouth College ) 开展 人 工 智能 的 研究 ”， 以 探究 “这 种 推测 ， 即 认为 认 知 的 每 个 
方面 或 智能 的 任何 其 他 特征 原则 上 都 能 够 被 精确 地 描述 ， 从 而 能 够 制造 出 模拟 它 的 机 器 "。 
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图 灵 测 试 已 不 再 被 认为 是 对 智能 的 有 效 度量 ， 其 中 一 个 原因 在 于 ， 相 对 简单 的 手法 会 产生 
(produce ) 怪诞 的 智能 显示 。 图 灵 测 试 场景 的 一 个 著名 示例 是 20 世 纪 60 年 代 中 期 由 Joseph 
Weizenbaum 开 发 的 程序 DOCTOR (更 通用 的 系统 版 本 称 为 ELIZA)。 这 个 交互 程序 被 设计 用 来 
反映 罗杰斯 分 析 师 指导 心理 治疗 的 场景 ， 计 算 机 扮演 了 分 析 师 的 角色 ， 而 用 户 扮 演 病人 。 在 内 
部 ，DOCTOR 所 做 的 一 切 是 根据 某 些 定义 明确 的 规则 将 病人 的 陈述 重新 构造 并 反馈 给 病人 。 例 
如 ， 回 应 病人 的 陈述 “我 今天 觉得 很 累 ” DOCTOR 可 能 回答 :“ 为 什么 你 今天 觉得 很 累 ? ”如 
果 DOCTOR 不 能 识别 句子 结构 ， 它 仅仅 作出 像 “继续 ” 或 者 “这 很 有 趣 ” 这 样 的 响应 。 

Weizenbaum 开 发 DOCTOR 的 目的 是 为 了 研究 自然 语言 的 交流 。 心 理疗 法 的 目标 仅仅 提供 了 
一 个 程序 可 以 “交流 ”的 环境 。 然 而 ，Weizenbaum 没 有 想到 的 是 ， 个 别 的 心理 学 家 建议 把 这 个 
程序 用 在 实际 的 心理 治疗 中 。( 罗 杰 斯 的 论点 是 ， 在 治疗 期 间 ， 应 该 是 病人 来 主导 对 话 ， 而 不 是 
分 析 师 。 所 以 他 们 认为 计算 机 也 能 像 治 疗 师 那样 引导 对 话 。) 而 且 , DOCTOR 表 现 出 极 强 的 理解 
能 力 ， 以 至 许多 与 它 “ 沟 通 ” 过 的 人 会 迎合 这 种 与 机 器 的 问答 式 对 话 。 在 某 种 意义 上 , DOCTOR 
通过 了 图 灵 测 试 。 其 结果 是 ， 在 道德 及 技术 上 都 产生 了 争议 ，Weizenbaum 成 为 一 位 在 技术 进步 
的 世界 中 维护 人 类 尊严 的 倡导 者 。 

较 新 的 图 灵 测 试 “ 成 功 ” 的 例子 包括 一 些 因特网 病毒 ， 为 了 诱 驳 人 类 放松 对 恶意 软件 的 防 
护 ， 这 些 病毒 与 人 类 受害 者 进行 “智能 ”对 话 。 此 外 ， 与 图 灵 测 试 类 似 的 现象 发 生 在 国际 象棋 
博弈 程序 这 样 的 计算 机 游戏 的 场景 中 。 尽 管 这 些 程序 是 通过 应 用 亦 力 技术 来 选择 棋 路 〈 这 与 我 
们 将 在 11.3 节 讨论 的 内 容 相 似 )， 但 人 类 在 同 计算 机 进行 竞赛 的 过 程 中 却 常 感觉 机 器 拥有 创造 力 
甚至 个 性 。 相 似 的 感觉 在 机 器 人 技术 领域 也 有 ， 根 据 物 理 属性 建造 的 机 器 表现 出 了 智能 特征 。 
例如 ， 玩 具 机 器 狗 仅 仅 通过 点 头 或 者 是 竖 耳 条 来 响应 声音 ， 就 表现 出 了 可 爱 的 个 性 。 


问题 与 练习 


1. 指出 一 个 智能 体 可 能 会 做 的 几 种 “智能 ”动作 。 
2. 一 棵 放 在 只 有 一 束 光 源 的 暗室 里 的 植物 , 会 朝 着 光源 方向 生长 。 这 是 一 种 智能 响应 吗 ? 植物 拥有 智能 
吗 ? 你 对 智能 的 定义 是 什么 ? : 下 le 
3. 假定 一 台 售 货机 根据 所 按 的 按钮 发 舍 不 同 的 物品 ,你 认为 这 样 的 一 台 机 器 是 否 “ 知 道 ” 按 了 哪个 按钮 ? 

你 对 “知道 ”的 定义 是 什么 ? 

4. 如 果 一 台 机 器 通过 了 图 灵 测 试 , 你 会 认同 这 台 机 器 是 智能 的 吗 ? 如 果 不 是 , 你 是 否认 同 该 机 器 看 上 去 
是 智能 的 ? 
5. 假设 你 使 用 聊天 室 通 过 因特网 与 某 人 聊天 (或 使 用 某 种 即时 通信 软件 ， 如 Instant Messenger)， 并 与 之 
进行 了 长 达 10 分 钟 的 意味 深长 的 连贯 谈话 。 如 果 你 在 稍 后 发 现 之 前 是 与 一 台 机 器 对 话 ， 你 是 否 会 认为 

这 台 机 器 是 智能 的 ? 为 什么 ? 


11.2 ”感知 


一 个 智能 体 要 想 智能 地 响应 从 它 的 传感器 接收 的 输入 ， 就 必须 能 够 理解 输入 。 也 就 是 说 ， 
智能 体 必 须 能 够 感知 。 本 节 我 们 来 探讨 感知 的 两 个 研究 领域 ， 即 理解 图 像 和 理解 语言 ， 这 两 个 
领域 被 证 明 特 别 具 有 挑战 性 。 


11.2.1 理解 图 像 
让 我 们 考虑 11.1 节 介绍 的 解决 八 数码 游戏 的 机 器 所 提出 的 问题 。 机 器 上 夹具 的 张 合 没有 表 
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现 出 严重 的 障碍 ， 在 这 个 张 合 的 过 程 中 ， 因 为 这 里 的 应 用 要 求 的 精度 不 高 ， 所 以 检测 夹具 中 是 
否 有 拼图 的 功能 也 很 简单 ， 即 使 是 摄像 机 对 拼图 的 对 焦 问 题 ， 也 可 以 通过 设计 夹具 把 拼图 安置 
在 一 个 预定 的 便于 观察 的 位 置 上 简单 地 解决 。 所 以 ， 机 器 需要 的 第 一 个 智能 行为 是 从 视觉 媒介 
中 提取 信息 。 

必须 认识 到 ， 我 们 的 机 器 在 看 拼图 时 所 面 对 的 问题 不 单 是 产生 和 存储 一 张 图 像 ， 这 方面 的 
技术 很 多 年 前 在 传统 的 摄影 及 电视 系统 中 就 能 做 到 。 相 反 ， 这 里 的 问题 是 为 了 提取 拼图 当前 的 
状态 ， 要 理解 这 个 图 像 〈 可 能 随后 还 要 监控 方块 的 移动 )。 

在 八 数码 游戏 机 器 的 案例 中 ， 对 拼图 图 像 的 可 能 解释 是 相对 有 限 的 。 我 们 可 以 假定 ， 在 一 
个 排列 好 的 模式 里 所 呈现 的 总 是 一 幅 包 含 数字 1 一 8 的 图 像 。 问 题 只 是 去 提取 这 些 数字 的 排列 。 
为 此 ， 我 们 想象 拼图 的 图 像 已 经 在 计算 机 内 存 中 ， 按 照 位 进行 编码 。 编 码 中 的 每 一 位 表示 具体 
像素 的 亮度 。 假定 图 像 的 大 小 统一 (机 器 把 拼图 放 在 摄像 机 前 的 预定 位 置 )， 把 图 像 的 不 同 部 分 
与 由 位 模式 构成 的 预定 模板 相 比 较 (位 模式 是 由 拼图 中 使 用 的 单个 数字 生成 的 ), 机 器 就 能 够 检 
测 出 哪个 方块 在 哪个 位 置 。 如 果 发 现 匹 配 ， 则 说 明 拼 图 达到 了 要 求 的 条 件 。 

这 种 识别 图 像 的 技术 是 光学 字符 阅读 器 中 使 用 的 一 种 方法 。 但 它 是 有 缺点 的 ， 它 对 被 读 的 
符号 在 类 型 、 大 小 以 及 方位 上 要 求 一 定 程度 的 一 致 性 。 特 别 是 ， 即 使 对 于 相同 的 符号 ， 外 形 也 
相同 ， 但 字体 较 大 的 字符 产生 的 位 模式 与 较 小 字体 的 模板 也 不 匹配 。 此 外 ， 可 以 想象 ， 当 试图 
处 理 手写 材料 时 ， 问 题 会 变 得 非常 困难 。 

解决 字符 识别 问题 的 另 一 个 方法 是 基于 匹配 几何 特征 的 ， 而 不 是 符号 的 精确 外 形 。 在 这 种 
情况 下 ， 数 字 1 表 示 为 一 条 单 竖 线 ， 数 字 2 可 能 代表 一 条 不 封闭 的 曲线 ， 底 部 与 一 条 水 平 直线 相 
连 ， 等 等 。 这 种 识别 符号 的 方法 分 两 步 : 第 一 步 是 从 要 处 理 的 图 像 中 提取 图 像 特 征 ， 第 二 步 是 
把 这 些 特征 与 那些 已 知 符号 的 特征 进行 比较 。 与 模式 匹配 方法 一 样 ， 这 种 符号 识别 技术 并 不 可 
靠 。 例 如 ， 图 像 的 少许 错误 会 产生 一 组 完全 不 同 的 几何 特征 ， 比 如 区 分 字母 0 和 C， 或 者 八 数码 
游戏 里 的 数字 3 和 8。 

幸好 在 八 数码 游戏 中 不 需要 理解 一 般 的 三 维 场景 。 例 如 ， 我 们 的 优势 是 能 保证 识别 的 形状 
《数字 1 一 8) 相互 孤立 地 处 在 图 像 上 的 不 同 部 分 ,而 不 是 常见 的 重 双 图像。 例如 ， 在 一 张 普通 的 
照片 中 ， 我 们 面临 的 不 仅 是 从 不 同 的 角度 识别 一 个 对 象 的 问题 ， 还 包括 被 遮蔽 的 对 象 的 某 些 
部 分 。 

理解 一 般 图 像 的 任务 通常 采取 两 步 进行 处 理 : (1) 图 像 处 理 (image processing)， 指 标识 图 
像 的 特征 ; (2) 图 像 分 析 (image analysis)， 指 理解 这 些 特征 代表 什么 意思 的 过 程 。 在 利用 符号 
的 几何 特征 识别 符号 的 描述 中 ， 我 们 已 经 提出 了 二 分 的 处 理 方法 。 在 这 个 过 程 中 ， 图 像 处 理由 
标识 在 图 像 中 发 现 的 几何 特征 的 过 程 来 表示 ， 图 像 分 析 由 标识 那些 特征 的 含义 的 过 程 来 表示 。 

图 像 处 理 带 来 了 大 量 的 研究 课题 。 一 个 是 轮廓 增强 ， 使 用 数学 技术 使 图 像 中 区 域 间 的 边界 
线 变 得 更 清晰 。 在 某 种 意义 上 上， 轮廓 增强 试图 将 照片 转换 成 线条 画 。 图 像 分 析 的 另 一 个 活动 是 
区 域 查找 。 这 是 标识 图 像 中 那些 区 域 的 过 程 ， 那 些 区 域 拥有 共同 的 属性 ， 如 亮度 、 颜 色 或 者 纹 
理 。 这样 的 一 个 区 域 很 可 能 代表 图 像 中 某 个 对 象 的 一 部 分 。( 这 种 识别 区 域 的 能 力 使 得 计算 机 可 
以 给 老式 的 黑白 电影 着 上 彩色 。) 图 像 处 理 领 域 还 包含 另 一 个 活动 一 一 平滑 (Smoothing)， 即 去 
除 图 像 中 缺陷 的 过 程 。 平 滑 使 图 像 中 存在 的 错误 不 会 混淆 其 他 图 像 处 理 步 又 ， 但 是 过 度 平 滑 也 
会 导致 重要 信息 的 丢失 。 

平滑 、 轮 廓 增强 以 及 区 域 发 现 都 是 用 来 标识 图 像 中 各 种 成 分 的 步 又。 图 像 分 析 是 确定 “这 
些 成 分 代表 什么 以 及 最 终 这 个 图 像 代表 什么 ”的 过 程 。 这 里 我 们 还 要 面 对 从 不 同 视角 识别 被 部 
分 遮挡 的 对 象 这 样 的 问题 。 图 像 分 析 的 一 种 方法 是 首先 假定 一 个 图 像 大 概 是 什么 ， 然 后 尝试 把 
图 像 中 的 成 分 与 那些 猜测 的 对 象 相 联系 。 这 看 起 来 是 人 类 所 使 用 的 方法 。 例 如 ， 有 时 我 们 会 发 
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现 ， 在 我 们 视觉 模糊 的 情况 下 ， 识 别 一 个 没有 想到 的 对 象 是 很 困难 的 ， 但 是 一 旦 有 一 个 该 对 象 
可 能 是 什么 的 线索 ， 我 们 就 能 容易 地 认 出 它 。 

与 一 般 图 像 分 析 相 关 的 问题 特别 多 ， 在 这 个 领域 还 有 许多 研究 要 做 。 图 像 分 析 这 个 领域 展 
示 了 ， 那 些 人 类 智能 能 够 很 快 又 非常 容易 完成 的 任务 ， 是 如 何不 断 挑战 机 器 能 力 的 。 
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A 
机 器 身上 呢 ? 

解决 强人 工 智 能 争辩 的 难点 在 于 ， 智能 和 意识 这 样 的 属性 是 内 在 特性 ， 不 能 够 直接 界定 。 
正如 阿兰 。 图 灵 指 出 的 那样 ,我 们 认为 其 他 人 属于 有 智能 的 是 因为 他 们 的 行为 表现 出 知 
能 一 -即使 我 们 不 能 观察 到 它们 内 部 的 智力 状态 。 那么 ， 如 果 机 器 也 呈现 外 在 的 意识 特性 ， 
我 们 是 否 准备 认可 机 器 具备 同样 的 水 准 呢 ? 为 什么 是 ， 为 什么 不 是 ? 


11.2.2 ”语言 处 理 


理解 语言 是 感知 问题 的 男 一 个 已 证 明 的 颇具 挑战 性 的 问题 。 把 形式 化 的 高 级 程序 设计 
语言 翻译 成 机 器 语言 ( 见 6.4 节 ) 获得 的 成 功 使 早期 的 研究 人 员 认 为 ,通过 编程 使 计算 机 具有 理 
解 自然 语言 的 能 力 将 在 几 年 后 变 成 现实 。 实 际 上 ， 翻 译 程序 的 这 种 能 力 给 
器 真能 理解 被 翻译 的 语言 。( 回 忆 6.1 节 中 Grace Hopper 讲 的 故事 ， 那 些 经 理 以 为 她 正在 教 计算 机 
理解 德语 。) 

这 些 研究 人 员 没 有 明白 形式 化 的 程序 设计 语言 与 英语 、 德 语 以 及 拉丁 语 这 些 自然 语言 之 间 
在 深度 上 的 差异 。 程 序 设计 语言 由 精心 设计 的 原 语 组 成 ， 每 个 语句 只 有 一 种 语法 结构 ， 只 有 一 
种 意思 。 相 反 ， 自 然 语 言 的 一 个 语句 会 因为 上 下 文 的 不 同 ， 甚 至 交流 方式 不 同 而 有 多 种 意思 。 
因此 ， 人 类 理解 自然 语言 很 大 程度 上 依靠 额外 的 知识 。 

例如 ， 句 子 

Norman Rockwell painted people. 

以 及 

Cinderella had a ball. 

都 有 多 种 意思 ， 但 通过 语法 分 析 或 单独 翻译 每 个 词 并 不 能 区 分 这 些 意思 。 实 际 上 ， 要 理解 这 些 
句子 需要 有 理解 句子 上 下 文 的 能 力 。 在 有 些 场合 ， 一 个 句子 的 真实 意思 与 它 的 字面 意思 完全 不 
同 。 例 如 ， 

“Do you know what time it is?”( 你 知道 几 点 了 吗 ? ) 
通常 的 意思 是 “Please tell me what time it is”( 请 告诉 我 现在 几 点 了 ), 或 者 如 果 说 话 者 已 经 等 候 
了 很 长 时 间 ， 那 么 这 句 话 意思 可 能 是 :“You are very late.”( 你 来 得 太 迟 了 。) 

要 和 弄 明白 一 种 自然 语言 中 的 一 个 句子 的 意思 需要 几 个 层次 的 分 析 。 第 一 层 是 句法 分 析 
(syntactic analysis)， 其 主要 成 分 是 语法 分 析 。 在 这 里 ， 句 子 
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Mary gave John a birthday card.〈 玛 丽 给 约翰 一 张 生 日 贺卡 。) 
的 主语 是 Mary， 而 句子 

John got a birthday card from Mary.《〈 约 翰 收 到 玛丽 赠送 的 一 张 生日 贺卡 。) 
的 主语 是 John。 

分 析 的 第 二 层 称 为 语义 分 析 〈semantic analysis)。 语 法 分 析 仅 标识 每 个 词 在 语法 上 的 作用 ， 
与 语法 分 析 不 同 ， 语 义 分 析 的 任务 是 标识 句子 中 每 个 词 在 语义 上 的 作用 。 语 义 分 析 试 图 标识 好 
内 容 有 : 描述 的 动作 、 动 作 的 主体 (不 一 定 是 句子 的 主语 ) 以 及 动作 的 目标 等 。 正 是 通过 语义 
分 析 ， 我 们 认为 句子 “玛丽 给 约翰 一 张 生日 贺卡 ”和 “约翰 收 到 玛丽 赠送 的 一 张 生 日 贺卡 ”是 
在 说 同一 件 事 情 。 

分 析 的 第 三 层 是 上 下 文 分 析 (contextual analysis)。 在 这 一 层 ， 句 子 的 上 下 文 被 引入 理解 过 
程 中 。 例 如 ， 很 容易 分 辨 出 句子 

The bat fell to the ground. 
中 的 每 一 个 单词 在 语法 上 的 作用 。 我 们 甚至 能 通过 识别 动作 “falling” 和 动作 主体 “bat” 等 来 
实现 语义 分 析 。 但 只 有 等 我 们 考虑 到 上 下 文 后 ， 句 子 的 意思 才能 变 得 明确 。 尤 其 是 ， 这 句 话 在 
棒球 比赛 这 样 的 背景 下 和 在 洞穴 中 探险 这 样 的 背景 下 有 着 不 同 的 意思 。 而 且 , 只 有 在 上 下 文 这 
一 层 ， 问 题 “ 你 知道 几 点 了 吗 ?” 的 真正 意思 才能 最 终 揭晓 。 

我 们 应 当 注 意 ， 各 个 层次 分 析 ( 旬 法 、 语 义 及 上 下 文 ) 并 不 一 定 相 互 独立 。 对 于 句子 

Stampeding cattle can be dangerous. 
如 果 我 们 想象 是 一 群 牛 在 惊 跑 ， 那 么 主语 是 名 词 cattle (stampeding 是 修饰 它 的 形容 词 )。 但 是 如 
果 语 境 是 哪个 恶作剧 者 以 惊吓 牛 群 取乐 , 那么 主语 就 是 动 名 词 stampeding (宾语 是 cattle)。 因 此 ， 
这 个 句子 不 只 有 一 个 语法 结构 一 一 究竟 哪 一 个 正确 要 依赖 于 上 下 文 。 

自然 语言 处 理 的 男 一 个 研究 领域 涉及 整个 文档 ， 而 不 是 单个 句子 。 这 里 涉及 的 问题 可 分 成 
两 类 : 信息 检索 (information retrieval) 和 信息 提取 (information extraction)。 信 息 检 索 的 任务 
是 标识 与 手头 论题 有 关 的 文档 。 例 如 ， 万 维 网 的 用 户 想 找到 与 特定 主题 相关 的 站 点 时 所 面 对 的 
问题 。 该 技术 的 当前 状态 是 为 关键 字 搜 索 站 点 ， 但 这 经 常 产生 大 量 的 假 结 果 ， 并 且 经 常会 由 于 
其 处 理 的 是 “automobiles” 而 不 是 “cars”， 从 而 忽略 一 个 重要 的 站 点 。 因 此 ， 我 们 就 需要 一 种 
能 理解 所 考虑 站 点 内 容 的 搜索 机 制 。 要 获得 这 样 的 理解 很 困难 ， 这 也 就 是 许多 搜索 机 制 都 转向 
采用 像 在 4.3 节 介绍 的 XML 这 样 的 技术 ， 来 产生 语义 网 Web 的 原因 。 

信息 提取 是 指 从 文档 中 提取 信息 这 样 的 任务 ,并 采用 一 种 形式 以 方便 用 于 其 他 应 用 程序 。 
这 个 意思 可 以 理解 为 为 一 个 特定 的 问题 确定 答案 ， 或 者 是 将 信息 以 某 种 格式 记录 ， 以 备 日 后 
解答 问题 时 使 用 。 有 一 种 这 样 的 格式 称 作 框 架 ( frame )， 框 架 实质 上 是 一 种 记录 细节 的 模板 。 
例如 ， 考 虑 一 个 读 报 系统 。 该 系统 可 以 利用 各 种 各 样 的 框架 ， 报纸 上 的 每 一 类 文章 用 一 个 。 
如 果 系统 认定 一 篇 文章 是 关于 入 室 盗窃 的 报道 ， 它 会 继续 试图 把 它 填写 到 入 室 盗窃 框架 的 位 
置 上 ， 该 框架 可 能 要 求 填 写 这 样 一 些 条 目 ， 如 失窃 地 点 、 失 寡 时 间 和 日 期 以 及 失 宁 物品 等 。 
相反 ， 如 果 系统 认定 一 篇 文章 是 关于 自然 灾害 的 报道 ， 那 么 它 会 填写 自然 灾害 框架 ， 引 导 系 
统 确定 灾害 类 型 、 损 失 的 大 小 等 。 

信息 提取 器 记录 信息 的 另 一 种 形式 称 为 语义 网 (semantic net)。 这 实质 上 是 一 个 大 的 链 式 数 
据 结 构 ， 结 构 中 的 指针 用 来 指示 数据 项 之 间 的 联系 。 图 11-3 显 示 了 一 个 语义 网 的 一 部 分 ， 突 出 
显示 的 部 分 是 从 句子 








Q 英文 单词 bat 有 蝙蝠 和 球 棒 两 种 意思 ， 在 棒球 比赛 中 应 指 “ 球 棒 ” 在 洞穴 中 探险 时 则 可 能 指 “ 蝙 蝠 ”。 
一 一 译 者 注 
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Mary hit John. 
中 得 到 的 信息 。 





从 句子 “Mary hit John.” 中 得 到 的 信息 


图 11-3 ”一 个 语义 网 
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3. 下 图 中 有 几 个 方块 ”怎样 对 一 个 机 器 编程 使 其 能 正确 回答 这 个 问题 ? 


全 


. 你 是 如 何 知道 句子 “Nothing is better than complete happiness” 和 句子 “A bowl of cold soup is better than 
nothing” 不 是 暗 指 “Abowlof cold soup is better than complete happiness” 的 ? 你 这 种 区 分 能 力 如 何 被 
移植 到 一 合 机 器 上 ? 

. 指出 在 翻译 句子 “They are racing horses” 时 的 二 义 性 。 

. 比较 下 列 两 个 句子 的 语法 分 析 结果 。 然 后 解释 二 者 在 语义 上 的 不 同 。 

The farmer built the fence in the field. 
The farmer built the fence in the winter, 


根据 图 11-3 中 的 语义 网 ，Mary 和 John 之 间 是 什么 家 庭 关 系 ? 


CN Cn 


二 





11.3 ”推理 和 
现在 ， 让 我 们 来 利用 11.1 节 介绍 的 求解 八 数码 游戏 的 机 器 来 探讨 开发 具有 基本 推理 能 力 的 
智能 体 的 技术 


11.3.1 产生 式 系统 


一 旦 八 数码 游戏 的 机 器 从 看 到 的 图 像 中 解读 出 方块 的 位 置 ， 它 的 任务 就 变 成 了 决定 需要 哪 
些 移动 来 求解 难题 。 马 上 可 以 想到 的 一 个 方法 是 ， 把 方块 的 所 有 可 能 排列 对 应 的 解决 方案 都 预 
先 编写 到 机 器 中 。 然 后 ， 机 器 的 任务 就 只 是 选择 和 执行 合适 的 程序 。 然 而 ， 这 个 八 数码 游戏 有 
100 000 多 种 布局 ， 所 以 对 每 一 种 布局 提供 一 个 直接 的 解决 方法 的 方案 显然 不 可 取 。 因 此 ， 我 们 
的 目标 是 对 机 器 编程 ， 让 机 器 能 够 自己 构建 难题 的 解决 方法 。 也 就 是 说 ， 必 须 对 机 器 编程 使 其 
能 够 实现 基本 的 推理 活动 。 

开发 机 器 的 推理 能 力 已 经 是 一 个 研究 多 年 的 主题 。 有 关 这 方面 的 研究 已 经 达成 一 个 共识 ， 
即 有 一 大 类 推理 问题 具有 共性 ， 这 些 共 性 被 单独 放 在 一 个 抽象 的 实体 中 ， 该 实体 称 为 产生 式 系 
统 〈production system)。 这 种 系统 由 三 个 主要 部 分 组 成 。 

(1) 状态 集合 。 每 个 状态 〈state) 是 一 个 可 能 在 应 用 环境 中 发 生 的 情形 。 最 初 的 状态 称 作 
开始 状态 〈start state) (或 者 初始 状态 )， 期 望 的 状态 称 作 目 标 状态 〈goal state)。( 在 我 们 的 案例 
中 ， 一 个 状态 就 是 指 八 数码 游戏 的 一 种 布局 ， 开 始 状 态 就 是 八 数码 游戏 提交 给 机 器 时 的 布局 ， 
目标 状态 就 是 图 11-1 所 示 的 已 经 解决 了 难题 的 布局 。) 

(2 ) 产生 式 集合 (又 称 规 则 或 者 移动 )。 产 生 式 〈production) 是 指 能 在 应 用 环境 中 执行 的 
让 系统 从 一 个 状态 转移 到 男 一 个 状态 的 操作 。 可 以 将 每 个 产生 式 一 些 先决 条 件 相 关联 ， 也 就 是 
说 ， 在 应 用 产生 式 之 前 ,环境 中 必定 会 出 现 一 些 可 能 存在 的 条 件 。( 在 我 们 的 案例 中 ， 产 生 式 就 
是 方块 的 移动 。 一 个 方块 每 次 移动 的 先决 条 件 是 其 相 邻 的 位 置 必须 有 空位 。) 

(3 ) 控制 系统 。 控 制 系统 (control system) 是 由 解决 问题 使 其 从 开始 状态 变换 到 目标 状态 
的 逻辑 组 成 的 。 在 处 理 过 程 的 每 一 步 ， 控 制 系统 都 要 决定 ， 在 满足 先决 条 件 的 那些 产生 式 中 ， 
下 一 步 该 执行 哪 一 个 。( 对 于 八 数码 游戏 的 例子 ,给 定 一 个 特定 状态 ， 在 空位 旁 有 儿 个 方块 ， 就 
存在 儿 个 可 用 的 产生 式 。 控 制 系统 必须 决定 移动 哪 一 个 方块 。) 
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注意 ， 在 一 个 产生 式 系统 的 上 下 文中 ， 赋 予 解决 八 数码 游戏 的 机 器 的 任务 可 以 被 公式 化 。 
在 这 种 情况 下 ， 控 制 系统 采用 程序 的 形式 。 该 程序 检查 八 数码 游戏 的 当前 状态 ， 确 定 实现 目标 
状态 的 一 系列 产生 式 ， 并 执行 这 一 系列 产生 式 。 因 此 ， 我 们 的 任务 就 是 为 解决 八 数码 游戏 设计 
一 个 控制 系统 。 

控制 系统 开发 中 的 一 个 重要 概念 是 问题 空间 (problem space)， 它 是 产生 式 系统 中 的 所 有 状 
态 、 产 生 式 以 及 先决 条 件 的 集合 。 问 题 空间 通常 会 概念 化 成 状态 图 (state graph) 的 形式 。 这 里 ， 
图 这 个 词 是 指 一 种 数学 家 称 为 有 向 图 (directed graph) 的 结构 ， 即 一 组 由 箭头 连接 起 来 的 称 为 
节点 (node) 的 位 置 。 一 个 状态 图 由 一 组 用 箭头 连接 的 节点 组 成 ， 节 点 表示 系统 中 的 状态 ， 第 
头 表 示 从 一 个 状态 转换 到 另 一 个 状态 的 产生 式 。 状 态 图 中 两 个 节点 被 一 个 箭头 连接 的 条 件 是 : 
当 且 仅 当 有 一 个 产生 式 ， 它 把 系统 从 箭头 起 点 处 的 状态 转换 到 箭头 终端 处 的 状态 。 

我 们 应 当 强 调 的 是 ， 正 像 在 解决 八 数码 游戏 时 拼图 可 能 状态 的 数量 使 我 们 难以 明确 地 提供 
预先 编写 好 的 解决 方案 一 样 ， 数 量 太 大 的 问题 也 使 得 我 们 不 能 明确 地 表示 整个 状态 图 。 所 以 ， 
状态 图 是 概念 化 手头 问题 的 一 种 方法 ， 但 不 能 用 来 表示 全 部 内 容 。 虽 然 如 此 ， 你 会 发 现 ， 它 有 
助 于 考虑 (并 可 能 扩展 ) 图 11-4 显 示 的 八 数码 游戏 的 一 小 部 分 状态 图 。 






图 11-4 八 数码 游戏 状态 图 的 一 小 部 分 

当 根据 状态 图 来 考虑 时 ， 控 制 系统 面临 的 问题 变 成 了 寻找 一 连 串 从 开始 状态 导向 目标 状态 
的 箭头 。 毕 竟 ， 这 一 连 串 的 箭头 代表 了 解决 初始 问题 的 一 系列 产生 式 。 所 以 ， 不 管 应 用 是 什么 ， 
控制 系统 的 任务 都 可 以 看 作 是 寻找 一 条 贯穿 状态 图 的 路 径 。 对 控制 系统 的 这 种 普 裔 观点 是 根据 
产生 式 系统 对 要 求 推 理 的 问题 进行 分 析 的 成 果 。 如 果 一 个 问题 能 够 根据 产生 式 系 统 来 描绘 ， 那 
么 它 的 解决 方法 就 能 够 根据 搜索 一 条 路 径 来 明确 表达 。 

为 了 强调 这 一 点 ， 我 们 先 来 考虑 其 他 任务 是 如 何 按照 产生 式 系 统 来 设计 ， 然 后 在 控制 系统 
通过 状态 图 发 现 路 径 的 背景 下 完成 的 。 人 工 智 能 的 经 典 问 题 之 一 就 是 下 国际 象棋 这 样 的 游戏 ， 
这 类 游戏 在 一 个 明确 规定 的 背景 下 属于 中 等 复杂 度 ， 因 此 ， 它 为 理论 测试 提供 了 一 个 理想 的 环 
境 。 在 国际 象棋 游戏 中 ， 基 本 产生 式 系 统 的 状态 是 可 能 的 棋盘 布局 ， 产 生 式 是 棋子 的 移动 ， 控 
制 系统 就 具体 为 棋 手 (人 或 别 的 )。 状 态 图 的 开始 节点 表示 棋子 在 初始 位 置 时 的 棋盘 。 从 该 节点 
出 发 的 分 支 是 一 些 箭头 ， 这 些 箭头 指向 游戏 中 棋子 第 一 步 移 动 之 后 会 形成 的 那些 棋盘 布局 ;而 
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从 这 每 一 个 布局 出 发 的 分 支 仍然 是 一 些 箭 头 ， 指 向 下 一 步 移 动 棋子 会 形成 的 那些 布局 ; 依次 类 
推 。 通 过 这 种 明确 的 表达 ， 我 们 可 以 把 一 个 国际 象棋 游戏 想象 为 由 两 个 选手 组 成 ， 每 个 选手 都 
试图 通过 在 一 个 大 的 状态 图 中 寻找 一 条 通 向 自己 选择 的 目标 节点 的 路 径 。 

或 许 从 给 定 事实 得 出 逻辑 推论 的 问题 是 一 个 不 太 明 显 的 产生 式 系统 的 例子 。 在 这 种 情况 下 ， 
产生 式 是 称 为 推理 法 则 (inference rule) 的 逻辑 规则 ， 这 些 规则 允许 从 旧 语 名 中 形成 新 语句 。 例 
如 ， 语 名 “所 有 超级 英雄 都 是 崇高 的 ”和 “超人 是 超级 英雄 ”可 以 合并 产生 “超人 是 崇高 的 ”。 
这 样 一 个 系统 中 的 状态 由 各 种 语句 组 成 ， 在 推导 过 程 的 一 些 特 定点 处 ， 这 些 语句 为 真 : 开始 状 
态 是 基本 语句 〈 常 称 为 公理 ) 的 集合 ， 从 中 可 以 得 出 结论 ; 而 目标 状态 则 是 包含 了 提出 结论 的 
语句 的 任意 集合 。 

例如 ， 图 11-5 显 示 了 以 下 推论 所 经 历 的 状态 图 的 一 部 分 : 从 一 组 语句 “ 苏 格 拉 底 是 男人 ”、 
“所 有 男人 都 是 人 ”及 “所 有 人 都 是 凡人 ”可 以 推出 “ 苏 格 拉 底 是 凡人 ”。 


开始 状态 










苏 格 拉 底 是 男人 
所 有 男人 都 是 人 
所 有 人 都 是 凡人 







苏 格 拉 底 是 男人 Ah 
午 有 男人 者 是 人 | ~ 苏 格 拉 底 是 人 









苏 格 拉 底 是 男人 
所 有 男人 都 是 人 
所 有 人 都 是 凡人 
苏 格 拉 底 是 人 


中 间 状 态 









苏 格 拉 底 是 男人 
所 有 男人 都 是 人 
所 有 人 都 是 凡人 
苏 格 拉 底 是 人 

苏 格 拉 底 是 凡人 


所 有 人 都 是 凡人 


苏 格 拉 底 是 人 “二 -> 苏 格拉 底 是 凡人 


目标 状态 


图 11-5 产生 式 系统 环境 中 的 演绎 推理 
从 中 我 们 看 到 ， 随 着 推理 过 程 应 用 合适 的 产生 式 来 生成 新 的 语句 ， 知 识 的 主体 从 一 个 状态 
转换 到 了 另 一 个 状态 。 当 今 ， 这 种 推理 系统 经 常 应 用 在 逻辑 程序 设计 语言 ( 见 6.7 节 ) 中 ， 它 是 
大 多 数 专家 系统 (expert system ) 的 骨干 。 专 家 系统 是 为 模拟 因果 推理 而 设计 的 软件 包 ， 这 些 推 
理 是 人 类 专家 面 对 相 同情 形 时 所 遵从 的 。 例 如 ， 医 疗 专家 系统 用 来 协助 疾病 诊断 或 改 展 治疗 。 
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我 们 已 经 看 到 ， 在 产生 式 系统 的 环境 中 ， 控 制 系 统 的 工作 涉及 搜索 状态 图 ， 找 出 从 开始 节 
点 到 目标 节点 的 一 条 路 径 。 完 成 这 种 搜索 的 一 个 简单 的 方法 就 是 仔细 观察 每 一 个 从 初始 状态 发 
出 的 箭头 ， 并 记录 下 每 一 个 目标 状态 ， 然 后 继续 仔细 观察 从 这 些 新 状态 发 出 的 箭头 ， 再 记录 下 
结果 ， 依 次 类 推 。 对 目标 的 搜索 像 向 水 中 滴 入 一 滴 墨 水 一 样 ， 从 开始 状态 扩散 开 来 。 这 个 过 程 
继续 进行 ， 直 到 一 个 新 状态 就 是 目标 状态 ， 这 时 ， 解 决 方法 就 找到 了 ， 控 制 系统 只 需要 治 独 找 
到 的 这 条 从 开始 状态 到 目标 状态 的 路 径 应 用 产生 式 即 可 。 
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这 种 策略 的 结果 实际 上 是 建立 一 棵 树 ， 称 作 搜索 树 (search tree)， 它 由 控制 系统 经 过 分 析 
得 到 的 部 分 状态 图 构成 。 搜 索 树 的 根 节 点 是 开始 状态 ， 每 个 节点 的 子 节点 由 那些 应 用 一 个 产生 
式 从 父 节点 可 到 达 的 状态 构成 。 搜 索 树 中 节点 间 的 每 条 线段 代表 一 
个 产生 式 的 应 用 , 从 根 到 叶子 的 每 一 条 路 径 代表 状态 图 中 相应 状态 
间 的 一 条 路 径 。 

解决 图 11-6 所 示 布 局 的 八 数码 游戏 将 会 产生 的 搜索 树 如 图 11-7 
所 示 。 该 搜索 树 最 左边 的 分 支 代 表 试 图 通过 最 初 向 上 移动 方块 6 来 
解决 问题 ， 中 间 分 支 表 示 癌 右 移动 方块 2 的 开局 方法 ， 而 最 右边 的 
分 支 表示 以 向 下 移动 方块 5 来 开局 。 搜 索 树 进一步 显示 ， 如 果 以 向 
上 移动 方块 6 来 开局 ， 那 么 下 一 个 允许 的 产生 式 只 能 是 方块 8 右 移 。( 实 际 上 ， 这 时 还 可 以 将 方块 
6 向 下 移动 ， 但 这 仅仅 是 上 一 个 产生 式 的 倒置 ， 因 而 是 毫 无 意义 的 移动 。) 





八 数码 游戏 























135 
42 
786 
2 
?8 786 * 
135 15 135 135 13 
426 2 42 482 425 
78 786 786 76 786 
135 135 15 15 135 35 135 135 123 3 
426 46 432 432 42 14. 482 2 45 425 
78 2 2 86 86 6 76 6 A 786 
135 135 TS 135 415 152 135 3 5 135 135 123 123 123 413 
26 46 436 46 32 43 742 142 82 48 45 485 45 25 
入 人 728 728 786 人 人 入 入 76 786 7 6 786 786 
35 135 35 135 15 15 13 135 415 415 152 152 135 135 345 35 135 35 135 13 123 23 123 123123 12 413 413 
126 2 6 146 746 436 436 465 4 4367 2 742 1 2 142 8 2 1824 8 485 745 145 485 485456 453725 2 5 
478 478 728 28 728728 728 72 786 8678678 846 86 786 786 476 476 762 762 8678676 76 | 786 86 786 
目标 
图 11-7 搜索 树 的 一 个 示例 
目标 状态 出 现在 图 11-7 显 示 的 搜索 树 的 最 下 面 一 层 。 En CE 
因为 这 表明 解决 方 法 找到 了 ， 所 以 控制 系统 可 以 结束 其 搜 。 全 一 全 时 入 So 
索 过 程 并 开始 构建 指令 序列 ， 该 指令 序列 将 用 来 解决 外 部 力 壶 证 称 0 
环境 中 的 拼图 难题 。 这 实际 上 是 一 个 简单 的 过 程 : 从 目标 1 
节点 的 位 置 上 行 ， 同 时 在 遇 到 由 树枝 线 表 示 的 产生 式 时 将 方 英 5 称 
它们 压 入 栈 。 将 这 种 技术 应 用 到 图 11-7 所 示 的 搜索 树 中 ， | 广 作 全称 就 二 


就 产生 了 图 11-8 中 所 示 的 产生 式 栈 。 现 在 ， 只 要 把 指令 从 FE 
该 栈 中 弹出 并 执行 ， 控 制 系 统 就 能 够 解决 外 界 的 问题 。 。 图 11-8 诗作 栈 的 产生 式 以 备 以 后 执行 

还 有 一 点 我 们 应 当 注 意 ， 回 想 第 8 章 我 们 讨论 的 树 ， 利 用 一 个 指针 系统 从 上 到 下 指示 一 棵 酝 ， 
由 此 可 以 从 一 个 父 节 点 移动 到 它 的 子 节点 。 但 是 在 搜索 树 的 情况 下 ， 控 制 系统 必须 能 够 从 一 个 
子 节点 移 到 其 父 节 点 ， 正 如 从 目标 状态 向 上 移 到 开始 状态 。 构 建 这 种 树 的 指针 系统 要 向 上 指 ， 
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而 不 是 向 下 指 。 也 就 是 说 ， 每 个 子 节 点 包含 了 一 个 指向 其 父 节 点 的 指针 ， 而 不 是 父 节点 包含 了 
指向 其 子 节 点 的 指针 。( 有 些 应 用 会 用 两 组 指针 ， 人 允许 在 树 中 双向 移动 。) 


11.3.3 ”启发 式 法 


对 于 图 11-7 显 示 的 例子 ， 我 们 选择 一 个 开始 布局 ， 产 生 了 一 个 容易 处 理 的 搜索 树 。 但 是 在 
试图 解决 一 个 比较 复杂 的 问题 时 ， 产 生 的 搜索 树 就 会 变 得 非常 庞大 。 在 国际 象棋 中 ， 第 一 步 移 
动 就 有 20 种 可 能 ， 因 此 在 这 样 的 情况 下 ， 搜 索 树 的 根 节点 将 会 有 20 个 子 节点 ， 而 不 是 我 们 例子 
中 的 3 个 。 而 且 ， 一 局 棋 双 方 都 移动 30 一 35 次 是 常 有 的 情况 。 即 使 是 八 数码 游戏 ， 若 不 能 很 快 到 
达 目 标 ， 搜 索 树 也 会 变 得 非常 大 。 结 果 ， 开 发 一 个 完整 搜索 树 同 表示 出 全 部 状态 图 一 样 都 是 不 
切实 际 的 。 

应 对 这 种 问题 的 一 种 策略 是 改变 搜索 树 构建 的 次 序 。 不 用 广度 优先 (breadth-first〉 的 方式 
(这 意味 着 树 是 一 层 一 层 地 构建 )， 我 们 可 以 沿 着 更 有 希望 的 路 径 往 深度 发 展 ， 但 只 有 在 原来 的 
选择 失败 以 后 才 考虑 其 他 选择 。 结 果 就 是 以 深度 优先 〈depth-first) 的 方法 构建 搜索 树 ， 也 就 是 
说 ， 树 是 以 建立 纵向 路 径 而 不 是 横向 层次 的 方式 构建 的 。 更 确切 地 说 ， 这 种 方法 通常 被 称 为 最 
佳 优先 《〈best-first) 结构 ， 因 为 在 搜索 中 被 选中 的 垂直 路 径 看 起 来 是 最 优 的 。 

最 佳 优先 的 方法 类 似 于 人 类 面 对 八 数码 游戏 时 应 用 的 策略 。 我 们 一 般 不 会 像 广度 优先 方法 
那样 ， 同 时 沿 着 几 个 可 能 的 路 径 进行 。 相 反 ， 我 们 大 概 会 选择 看 起 来 最 有 希望 的 路 径 并 首先 沿 
着 这 条 路 径 走 下 去 。 注 意 ， 我 们 说 的 是 看 上 去 最 有 和 希望 的 。 在 一 个 特定 点 ， 很 难 确定 哪个 选择 
是 最 佳 的 。 只 赁 感觉， 当然 可 能 “ 误 入 歧途 ”。 但 不 管 怎 样 ， 相 比 “一 视 同 仁 ” 地 关注 每 种 选择 
的 亦 力 方法 ， 这 种 赁 直觉 的 方法 似乎 更 具 优势 ， 所 以 在 自动 控制 系统 中 应 用 直觉 的 方法 似乎 是 
明智 的 。 

为 此 ， 我 们 需要 一 个 方法 来 确定 几 个 状态 中 哪 一 个 看 上 去 是 最 有 希望 的 。 我 们 的 方法 是 采 
用 启发 式 (heuristic)， 在 本 书 的 示例 中 ， 这 是 与 每 个 状态 相关 的 一 个 数值 ， 用 来 衡量 这 个 状态 
与 最 近 目 标 之 间 的 “距离 ”。 在 某 种 意义 上 ， 启 发 式 是 对 规划 代价 的 一 个 衡量 。 给 定 两 个 状态 之 
间 的 一 个 选择 ， 那 么 从 具有 较 小 启发 值 的 状态 到 达 目 标 ， 显 然 花 的 代价 更 小 。 因 此 ， 该 状态 代 
表 了 应 遵循 的 方向 。 

启发 式 应 具备 两 个 特征 。 第 一 ， 如 果 到 达 相 应 的 状态 ， 它 必须 对 该 解决 方案 中 剩余 的 工作 
量 有 一 个 合理 的 估计 。 这 意味 着 它 在 多 个 选项 中 作出 选择 时 能 提供 有 意义 的 信息 一 一 启发 式 提 
供 的 估计 越 好 ， 根 据 此 信息 所 做 的 决定 就 越 好 。 第 二 ， 启 发 式 应 容易 计算 。 这 意味 着 它 的 利用 
应 有 益 于 搜索 过 程 而 非 成 为 一 种 负担 。 如 果 计 算 启 发 式 非常 复杂 ， 那 倒 不 如 把 时 间 花 费 在 推导 
一 个 广度 优先 树 上 。 

在 八 数码 游戏 中 ， 一 个 简单 的 启发 式 要 通过 计算 不 在 合适 位 置 上 的 方块 数目 来 估计 到 达 
目标 的 “距离 ”一 一 这 种 推测 指 的 就 是 一 个 有 4 个 方块 不 在 合适 位 置 上 的 状态 ， 相 对 于 只 有 2 
个 方块 不 在 合适 位 置 上 的 状态 来 说 离 目标 更 远 〈 也 就 因此 更 缺少 吸引 力 )。 然 而 ， 启 发 式 并 没 
有 考虑 方块 离 其 位 置 有 多 远 。 假 如 这 两 个 方块 离 它们 的 正确 位 置 太 远 ， 就 需要 许多 产生 式 来 
移动 它们 。 

于 是 ， 一 个 比较 好 的 启发 式 测算 每 个 方块 离 其 终点 的 距离 ， 并 把 这 些 值 相 加 得 到 一 个 量 。 
一 个 直接 挨 着 其 终点 的 方块 的 距离 值 为 1， 而 有 一 个 角 与 其 终点 方块 相 接触 的 方块 的 距离 值 为 2 
《因为 它 至 少 要 在 垂直 方向 和 水 平方 向 各 移动 一 次 )。 这 种 启发 式 容易 计算 ， 并 对 拼图 从 当前 状 
态 到 目的 状态 过 程 中 需要 移动 的 步 数 有 一 个 粗略 的 估计 。 例 如 ， 图 11-9 所 示 布 局 相应 的 启发 值 
为 7 因为 方块 2>、5 和 8 与 其 终点 的 距离 都 为 1， 而 方块 3 和 6 与 终点 的 距离 都 为 2)。 实 际 上 ， 它 的 
确 需要 移动 7 步 来 完成 拼图 。 
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既然 我 们 有 了 八 数码 游戏 的 一 个 启发 值 ， 下 一 步 就 是 把 它 结合 进 决策 过 程 。 我 们 知道 ， 人 
在 做 决定 的 时 候 倾向 于 选择 看 起 来 更 接近 目标 的 选项 。 所 以 我 们 的 搜索 过 程 应 当 考虑 树 中 每 个 
叶子 节点 的 启发 式 , 并 且 从 启发 值 最 小 的 叶子 节点 进行 搜索 。 这 就 是 图 11-10 所 采用 的 搜索 策略 ， 
图 中 给 出 了 开发 一 个 搜索 树 并 执行 得 到 的 解决 方法 的 算法 。 


创建 状态 图 的 开始 节点 作为 搜索 树 的 根 节 点 , 并 记 
录 它 的 启发 值 。 
while (目标 节点 还 没有 到 达 ) : 
选择 所 有 叶子 节点 中 有 最 小 启发 值 的 最 左边 的 
叶子 节点 。 
这 些 方 块 距 原始 将 这 个 选 定 的 节点 作为 子 节 点 附加 到 通过 单个 
位 置 至 少 移动 一 次 产生 式 能 到 达 的 那些 节点 上 。 





在 搜索 树 中 这 个 节点 的 旁边 记录 每 一 个 新 节点 
的 启发 值 。 
从 目标 节点 向上 遍历 搜索 树 一 直到 根 节点 , 把 与 每 
这 些 方块 距 原始 个 经 过 的 线段 相关 联 的 产生 式 压 入 栈 。 
2 一 二 - /和 六 口 » 沾 7 一 1 也 - yh i 3 
位 置 蔡 少 移动 两 次 通过 执行 从 栈 中 弹出 的 产生 式 解 决 原始 问题 
图 11-9 一 个 尚未 解决 的 八 数码 游戏 图 11-10 采用 启发 式 法 的 控制 系统 的 一 个 算法 


让 我 们 把 这 个 算法 应 用 到 八 数码 游戏 ， 从 图 11-6 给 出 的 初始 布局 开始 。 首 先 ， 我 们 建立 初 
始 状 态 并 将 它 作 为 根 节点 ， 记 录 下 它 的 启发 值 5。 然 后 ， 如 图 11-11 所 示 ，while 语 句 的 第 一 次 循 
环 添加 了 3 个 从 初始 状态 能 达到 的 节点 。 注意 , 我 们 已 经 在 节点 下 的 括号 里 记录 了 每 一 个 叶子 节 
点 的 启发 值 。 


目标 还 没有 达到 ， 所 以 我 们 再 次 执行 while 语 句 循环 体 ， 这 次 是 从 最 左边 的 节点 有 最 小 
启发 值 的 最 左边 的 叶子 节点 ”) 扩展 搜索 。 结 果 ， 搜 索 树 呈 图 11-12 所 示 的 形式 。 

现在 , 最 左边 叶子 节点 的 启发 值 是 5, 说 明 这 个 分 支 也 许 根 本 不 是 一 个 好 选择 。 算 法 注意 到 
这 一 点 ， 在 下 一 次 循环 时 ，while 语 句 会 指示 我 们 从 最 右边 的 节点 〈 它 现在 是 “有 最 小 启发 值 
的 最 左边 叶子 节点 ”) 开始 扩展 树 。 这 样 扩 展 后 的 搜索 树 如 图 11-13 所 示 。 





图 11-11 我 们 的 启发 式 搜索 的 开始 图 11-12 2 次 搜索 后 的 搜索 树 
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这 时 ,算法 好 像 走 上 了 正轨 。 因 为 最 右边 节点 的 启发 值 只 有 一 个 3，while 语 句 指示 我 们 继 
续 沿 着 这 条 路 径 进 行 ， 搜 索 直 瞄 目 标 ， 产 生 了 如 图 11-14 所 示 的 搜索 树 。 这 个 树 同 图 11-7 所 示 的 
搜索 树 相 比较 表明 ， 新 算法 即使 早期 走 了 点 弯路 ， 但 启发 信息 的 利用 已 经 大 大 减少 了 搜索 树 的 
大 小 ， 并 且 处 理 效率 大 大 增加 。 


12 
(2) 453 
786 





图 11-13 3 次 搜索 后 的 搜索 树 图 11-14 用 启发 系统 形成 的 完整 搜索 树 


在 到 达 目 标 状态 之 后 ，while 语 句 终止， 我 们 从 目标 节点 反 向 向 上 移动 到 根 节点 ， 把 沿途 
遇 到 的 产生 式 压 入 一 个 栈 。 结 果 产 生 的 栈 就 像 前 面 描述 的 那样 ， 如 图 11-8 所 示 。 

最 后 ， 当 这 些 产生 式 从 栈 中 弹出 时 ， 我 们 得 到 指示 ， 执 行 它们 。 这 时 ， 我 们 可 以 看 到 解决 
拼图 难题 的 机 器 放下 它 的 指 杆 ， 开 始 移动 方块 。 

关于 启发 式 搜索 的 最 后 一 点 说 明 是 按 顺 序 。 我 们 在 这 一 节 中 推荐 的 算法 通常 称 为 最 佳 适应 
算法 , 但 它 并 不 能 保证 是 所 有 应 用 的 最 佳 解决 方案 。 例如 ， 当 使 用 汽车 的 全 球 定位 系统 (GPS ) 
寻找 到 达 某 一 城市 的 路 线 时 , 人 们 通常 希望 找到 最 近 的 路 线 , 而 不 是 任意 一 条 路 。 A* 算 法 (A* 
algorithm， 读 作 “A 星 算法 ”) 是 最 佳 适应 算法 的 修改 版 ， 它 可 找到 一 个 最 佳 方案 。 这 两 种 算 
法 的 一 个 主要 区 别 是 ， 除 启发 值 外 ，A* 算 法 还 会 考虑 在 选择 下 一 个 节点 时 到 达 每 一 个 叶 节 点 
的 “累计 成 本 ”。( 对 于 汽车 的 GPS， 这 一 成 本 是 GPS 从 其 内 部 数据 库 中 获得 的 行进 距离 。〉 因 
此 , A* 算 法 的 判定 以 其 对 可 能 的 完整 潜在 路 径 的 成 本 估计 为 基础 , 而 不 仅仅 基于 对 剩余 成 本 的 
推测 。 






“人工 智能 早期 工作 研究 的 课题 涉及 直接 编写 程序 来 模拟 智能 . 但 是 , 今天 许多 人 认为 ， 
人 类 的 智能 并 非 基于 复杂 程序 的 执行 ， 而 是 在 经 历 了 世代 进化 后 形成 的 简单 的 刺激 一 反 
应 功能 。 这 种 关于 “智能 ”的 理论 称 为 “基于 行为 的 智能 *， 因 为 “智能 的 ”刺激 一 反应 
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功能 似乎 是 一 些 行为 的 结果 ， 这 些 行为 导致 菜 些 个 体 在 其 他 个 体 遇 难 时 得 以 幸免 并 能 繁 
衍 后 代 。 

基于 行为 的 智能 似乎 能 回答 人 工 智 能 范畴 的 若干 问题 ， 例 如 ， 为 什么 基于 冯 。 诺 依 曼 体 
系 结构 的 机 器 在 计算 能 力 上 能 轻易 地 胜 过 人 类 ， 却 难以 展现 常识 性 的 判断 力 。 因 此 ， 基 于 行 
为 的 智能 有 希望 成 为 人 工 智 能 研究 中 的 一 个 重要 的 影响 因素 。 正 如 文中 描述 的 那样 ， 基 于 行 
为 的 技术 已 经 应 用 在 : 人 工 神 经 网 络 领域 ， 训 练 神经 元 如 何 按 所 期 望 的 方式 表现 ; 遗传 算法 
领域 ， 为 更 传统 的 程序 设计 过 程 提 供 一 个 可 供 选 择 的 方法 ; 以 及 机 器 人 领域 ， 通 过 反应 策略 
来 改进 机 器 的 性 能 。 


问题 与 练习 
1. 产生 式 系统 在 人 工 智 能 中 有 什么 重要 意义 ? 
2. 画 出 八 数码 游戏 中 ， 围 绕 着 代表 下 图 状态 的 节点 的 那 部 分 状态 图 : 


5 





ES 


. 用 笔 、 纸 以 及 广度 优先 方法 ,构建 出 以 下 图 为 开始 状态 解决 八 数码 游戏 时 所 产生 的 搜索 树 (不 必 做 
完 )， 你 会 碰 到 什么 问题 ? 





(入 


.登山 者 为 到 达 顶 峰 , 只 考虑 局 部 地 形 , 并 总 是 沿 着 最 陡峭 的 上 坡 行 进 , 解决 八 数码 游戏 的 启发 式 系统 
与 登山 者 之 间 有 什么 相似 之 处 ? 
. 利用 本 节 所 讲 的 启发 式 方法 ， 采 用 图 11-10 所 示 的 最 佳 控制 系统 算法 ， 解 决 下 面 给 出 的 八 数码 游戏 : 


SN 





改进 我 们 计算 八 数码 问题 中 一 个 状态 的 启发 值 的 方法 ， 使 图 11-10 所 示 的 搜索 算法 不 会 作出 错误 
的 选择 ， 就 像 在 本 节 中 的 例子 那样 。 你 能 否 举 出 一 个 例子 ， 改 进 的 启发 值 仍然 会 导致 搜索 “ 误 入 
歧途 ”? 

. 下 面 是 寻找 从 Leesburg 到 Bedford 的 路 线 时 由 最 佳 适应 算法 得 到 的 搜索 树 〈 见 图 11-10)。 这 一 搜索 树 中 
的 每 一 个 节点 都 是 地 图 上 的 一 个 城市 ， 其 中 一 个 节点 表示 Leesburg。 当 扩展 一 个 节点 时 ， 仅 添加 与 当 
前 被 扩展 的 城市 直接 相连 的 城市 。 在 每 一 个 节点 中 记录 它 到 Bedford 的 直线 距离 ， 并 将 此 用 作 启 发 值 。 
最 终 得 到 的 最 佳 适应 算法 解决 方案 是 什么 ?我 们 得 到 的 是 否 为 最 短路 线 ? 


oo 


从 以 下 城市 到 Bedford 的 直线 距离 : 
Dayton 16 
Leesburg 34 
Stone 19 





9. A* 算 法 从 两 个 主要 方面 修改 了 最 佳 适应 算法 。 首 先 ，A* 算 法 记录 了 到 达 每 个 状态 的 实际 成 本 。 对 于 
地 图 上 的 路 线 ， 实 际 的 成 本 便 是 行进 的 距离 。 其 次 ， 当 选择 一 个 要 扩展 的 节点 时 ，A* 算 法 选择 其 实 
际 成 本 与 启发 值 之 和 最 小 的 节点 。 根 据 这 两 个 修改 ， 请 绘制 问题 8 的 搜索 树 。 在 每 一 个 节点 中 记录 行 
进 至 这 一 城市 的 距离 、 到 达 目 标 城市 的 启发 值 ， 以 及 它们 的 和 。 最 终 的 解决 方案 是 什么 ? 最 终 的 解决 
方案 是 最 短路 线 吗 ? 
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11.4 ”其 他 研究 领域 


本 节 ， 我 们 来 探究 人 工 智能 领域 一 直 挑 战 研究 人 员 的 主题 ， 知 识 处 理 、 学 习 以 及 处 理 非常 
复杂 的 问题 。 这 些 活 动 对 人 脑 来 说 很 简单 ， 但 是 对 机 器 来 说 却 负担 沉重 。 目 前 ， 本 质 上 通过 避 
免 直接 面 对 这 些 问题 (或 许 通过 应 用 聪明 的 简化 方法 或 限制 问题 出 现 的 范围 ) 在 开发 “智能 ” 
体 方面 已 经 取得 了 很 大 的 进展 。 


11.4.1 知识 的 表达 和 处 理 


在 关于 感知 的 讨论 中 ， 理 解 图 像 需要 大 量 的 关于 图 像 细 节 的 知识 ， 理 解 一 句 话 的 意思 可 能 
要 依赖 其 所 处 的 上 下 文 。 这 些 都 是 知识 仓库 起 作用 的 例子 ， 知 识 仓库 经 常 称 为 真实 世界 的 知识 
(real-world knowledge)， 是 由 人 脑 维护 的 。 人 类 以 某 种 方式 存储 大 量 的 信息 并 且 以 极 高 的 效率 
从 这 些 信息 中 汲取 有 用 的 信息 。 赋 予 机 器 这 种 能 力 是 人 工 智能 面临 的 一 个 重要 挑战 。 

潜在 的 目标 是 找到 表示 和 存储 知识 的 途径 。 这 是 很 复杂 的 ， 就 像 我 们 已 经 看 到 的 事实 那样 ， 
知识 以 陈述 性 和 过 程 性 这 两 种 形式 出 现 。 因 此 ， 知 识 表示 不 仅 是 事实 的 表示 ， 而 是 包含 了 一 个 
更 广泛 的 领域 。 因 此 ， 能 和 否 最 终 找到 一 种 用 来 表示 所 有 形式 知识 的 单一 方案 是 值得 怀疑 的 。 

然而 ， 问 题 不 仅仅 是 表示 和 存储 知识 。 知 识 也 必须 是 容易 理解 的 ， 但 获取 这 种 理解 是 一 个 
挑战 。11.2 节 介绍 的 语义 网 通常 用 来 作为 知识 表示 和 存储 的 一 种 手段 ， 但 是 ， 从 中 提取 信息 可 
能 是 有 问题 的 。 例 如 ， 句 子 “Mary hit John ”的 意思 依赖 于 Mary 和 John 的 相对 年 龄 〈 是 2 岁 和 30 
岁 或 是 相反 ? )。 这 种 信息 可 能 被 存储 在 图 11-3 给 出 的 完整 的 语义 网 中 ,但 是 在 上 下 文 分 析 的 过 
程 中 ， 提 取 这 样 的 信息 需要 对 语义 网 进行 大 量 的 搜索 。 

处 理 知 识 存 取 还 有 另外 一 个 问题 是 ， 知 识 的 确定 不 是 明确 的 ， 而 是 含蓄 的 ， 是 与 手头 的 任 
务 相 联系 的 。 相 对 于 直接 用 一 个 “没有 ”来 回答 问题 “ 亚 瑟 赢 了 比赛 吗 ? ” 我 们 希望 系统 可 以 
这 样 回答 :“ 没 有 ， 他 因为 流感 病 倒 了 ， 没 有 赢得 比赛 。” 下 一 节 我 们 将 探究 联想 记忆 的 概念 ， 
这 是 试图 解决 这 个 有 关系 的 信息 问题 的 一 个 研究 领域 。 然 而 ， 任 务 不 仅仅 是 找到 有 关系 的 信 
息 ， 我 们 需要 系统 能 够 区 分 有 关系 的 信息 和 相关 联 的 信息 。 例 如 ,“ 不 ,他 是 一 月 份 出 生 的 ， 他 
妹妹 的 名 字 叫 丽 莎 。” 这 样 的 回答 对 于 前 面 的 问题 来 说 是 没有 意义 的 ,即使 该 信息 是 通过 某 些 相 
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关 的 方式 提交 的 。 

开发 更 好 的 知识 提取 系统 的 另 一 个 方法 是 向 提取 过 程 插入 各 种 各 样 的 推理 ， 结 果 产 生 了 称 
为 元 推理 (meta-reasoning) 的 方法 ， 即 关于 推理 的 推理 。 例 如 ， 数 据 库 搜 索 最 初 是 使 用 的 是 封 
闭 世界 假设 (closed-world assumption )。 这 种 假设 先 假设 一 个 语句 为 假 ， 除 非 它 能 够 从 可 用 的 信 
县 中 明确 得 出 。 例 如 ， 封 闭 世界 假设 允许 数据 库 作 出 Nicole Smith 没 有 订阅 特定 的 杂志 这 样 的 推 
断 ， 即 使 数据 库 中 没有 包含 任何 关于 Nicole 的 信息 。 处 理 过 程 就 是 观察 Nicole Smith 不 在 订阅 列 
表 中 ， 然 后 应 用 封闭 世界 假设 推断 Nicole Smith 没 有 订阅 。 

封闭 世界 假设 表面 上 看 起 来 是 可 行 的 ， 但 是 结果 证 明 ， 单 纯 的 元 推理 技术 可 能 会 产生 微妙 
的 、 不 合 需要 的 结果 。 例 如 ， 假 定 我 们 仅 有 的 知识 是 一 条 语句 : 

Mickey is a mouse OR Donald is a duck. 

只 看 这 个 句子 ， 我 们 不 能 推断 出 Mickey 实 际 上 是 一 只 老鼠 。 因 此 ， 封 闭 世 界 假设 会 强制 断定 
语句 

Mickey is a mouse. 

为 假 。 以 相同 的 方式 ， 封 闭 世界 假设 会 强制 断定 句子 

Donald is a duck. 

为 假 。 这 样 ， 尽 管 两 个 句子 中 至 少 有 一 个 为 真 ， 但 是 封闭 世界 假设 已 经 引导 我 们 得 出 了 相 矛 盾 
的 结论 : 两 个 句子 都 为 假 。 理 解 这 种 看 似 可 行 的 元 推理 技术 的 结果 是 人 工 智能 和 数据 库 这 两 个 
领域 研究 的 一 个 目标 ， 同 时 也 强调 了 涉及 智能 系统 开发 的 复杂 性 。 

最 后 ， 有 一 个 称 为 框架 问题 (frame problem) 的 问题 ， 用 来 在 变化 的 环境 中 使 存储 的 知识 
保持 最 新 。 如 果 一 个 智能 体 打算 使 用 它 的 知识 来 决定 其 行为 ， 那 么 ， 该 知识 必须 是 当前 的 。 但 
是 , 支持 智能 行为 所 需 知识 的 数量 是 庞大 的 , 在 变化 的 环境 中 维护 这 些 知 识 是 一 项 繁重 的 工作 。 
一 个 复杂 的 因素 是 ， 在 一 个 环境 中 发 生 的 改变 经 常会 间接 地 改变 信息 中 的 其 他 细节 ， 而 且说 明 
这 种 间接 影响 的 结果 是 很 困难 的 。 例 如 ， 如 果 一 个 花瓶 被 敲 碎 了 ， 尽 管 水 洒 了 是 打 碎 花瓶 的 唯 
一 间接 结果 ， 但 对 于 这 种 状况 ， 你 的 知识 不 会 再 包括 水 在 花瓶 中 这 样 的 事实 。 因 此 ， 解 决 框架 
问题 不 仅 需 要 以 一 种 有 效 的 方式 来 存储 和 获取 大 量 信息 的 能 力 ， 而 且 要 求 存 储 系 统 能 够 正确 地 
反应 间接 的 推论 。 


11.4.2 ”学习 


除了 表示 和 处 理 知识 ， 我 们 还 希望 赋予 智能 体 获取 新 知识 的 能 力 。 我 们 可 以 问题 通过 编写 
和 安装 一 个 新 程序 或 者 显 式 地 向 存储 数据 中 添加 新 知识 来 “ 教 ”基于 计算 机 的 智能 体 ， 但 是 我 
们 更 希望 智能 体能 够 自己 学 习 。 我 们 希望 智能 体能 够 适应 环境 的 变化 并 执行 任务 ， 这 些 任务 并 
不 是 通过 事先 简单 地 编写 程序 就 能 够 完成 的 。 一 个 为 做 家 务 而 设计 的 机 器 人 将 面 对 新 家 具 、 新 
设备 、 新 宠物 甚至 是 新 主人 ; 一 辆 能 自己 驾驶 的 轿车 必须 能 适应 道路 边界 线 的 变化 ， 博 弈 智能 
体 应 当 能 够 开发 和 应 用 新 的 策略 。 

一 种 把 计算 机 学 习 的 途径 进行 归 类 的 方法 是 根据 需要 人 类 干涉 的 程度 。 学 习 的 第 一 层 是 模 
仿 Cimitation)， 人 类 直接 演示 一 个 任务 的 步骤 (可 能 是 通过 执行 一 系列 的 计算 机 操作 或 是 通过 
一 系列 动作 将 机 器 人 移动 ), 而 计算 机 仅仅 是 记录 这 些 步 又 。 这 种 形式 的 学 习 应 用 在 电子 表格 和 
字 处 理 软件 等 应 用 程序 中 已 经 很 多 年 了 ， 这 些 应 用 软件 记录 频繁 发 生 的 指令 序列 ， 然 后 通过 一 
个 请 求 就 可 以 重 放 。 注 意 ， 通 过 模仿 学 习 ， 智 能 体 承担 的 责任 很 少 。 

学 习 的 下 一 层 是 监督 训练 (supervised training )。 在 监督 训练 过 程 中 ， 人 对 一 连 串 的 示例 确 
定 正 确 的 反应 ， 然 后 智能 体 对 这 些 示 例 进行 归纳 ， 开 发 出 一 种 适用 于 新 案例 的 算法 。 这 一 连 串 
的 示例 称 为 训练 集 (training set)。 监 督 训练 的 典型 应 用 包括 学 习 识 别 一 个 人 的 笔迹 或 声音 ， 学 


362 第 :11 章 人 工 知 能 


习 区 分 垃圾 邮件 和 受 欢迎 的 邮件 ， 以 及 学 习 如 何 通 过 一 组 症状 判断 疾病 。 

学 习 的 第 3 层 是 强化 (reinforcement)。 在 通过 强化 进行 学 习 的 过 程 中 , 智能 体能 通过 对 一 个 
任务 的 反复 试验 的 成 功 与 失败 得 到 一 个 一 般 规则 ， 指 导 自 己 进行 判断 。 通 过 强化 进行 学 习 对 于 
学 习 如 何 玩 国际 象棋 或 西洋 跳棋 这 样 的 游戏 是 很 有 帮助 的 ， 因 为 胜 负 容 易 界 定 。 相 对 于 监督 训 
练 ， 当 智能 体 学 习 改 善 自 身 的 行为 时 ， 通 过 强化 进行 学 习 人 允许 智能 体 自 动作 出 反应 。 

因为 还 没有 发 现 指 导 所 有 可 能 的 学 习 行 为 的 通用 的 学 习 规 则 ， 所 以 学 习 一 直 是 一 个 有 挑战 
性 的 研究 领域 。 然 而 ， 有 大 量 的 例子 说 明 人 们 已 经 取得 了 进展 。 其 中 一 个 就 是 在 卡 内 基 梅 隆 大 
学 开发 的 基于 神经 网 络 的 地 面 自 动 驾 驶 车 辆 (Autonomous Land Vehicle in a Neural Net， 
ALVINN) 系统 ， 该 系统 学 习 如 何 驾 驶 一 辆 配 有 一 台 车 载 电 脑 的 大 篷车 ， 车 载 电 脑 使 用 一 台 摄 
像 机 作为 输入 。 这 里 所 采用 的 方法 就 是 监督 训练 。ALVINN 从 人 类 驾驶 员 那 里 搜集 数据 并 且 利 
用 这 些 数 据 调 整 自己 的 驾驶 决策 。 通 过 学 习 ， 该 系统 可 以 预测 向 哪里 驾驶 ， 对 照 人 类 罗 驶 员 的 
数据 来 检查 自己 的 预测 ， 然 后 修改 自己 的 参数 使 其 更 接近 人 类 的 驾驶 选择 。ALVINN 获 得 了 很 
大 的 成 功 ， 它 能 够 以 每 小 时 70 英 里 的 速度 驾驶 大 篷车 ， 同 时 带动 了 其 他 方面 的 研究 ， 已 经 产生 
了 可 以 成 功 在 道路 上 高 速 驾 驶 的 控制 系统 。 





知识 表示 和 存储 中 很 重要 的 一 点 就 是 ， 要 采用 与 存 取 知识 的 系统 相 兼容 的 方式 来 完成 。 
只 有 这 样 ， 逻 辑 程序 设计 ( 见 6.7 节 ) 才 通 常 是 有 利 的 。 在 这 样 的 系统 中 ， 知 识 用 
本 
和 和 
机 ol Xi is an bien pi Xis seta 
这 样 的 “逻辑 ”语句 来 表达 。 这 样 的 语句 能 够 用 符号 系统 来 表达 ， 从 而 方便 地 应 用 推理 规则 。 
图 11-5 所 示 的 演绎 推理 序 列 就 可 以 采用 直接 的 方式 实现 。 因 而 在 逻辑 程序 设计 中 ， 知 识 的 表 
达 和 存储 与 知识 的 提取 和 应 用 过 程 很 好 地 整合 在 了 一 起 . 可 以 说 ， 逻 辑 程 序 设计 系统 为 知识 
的 存储 和 应 用 提供 了 完美 的 衔接 。 


最 后 ， 我 们 应 该 认识 一 个 与 学 习 紧 密 相关 的 一 个 现象 发现 。 两 者 的 区 别 是 ， 学 习 是 “ 基 
于 目标 的 ”而 发 现 不 是 。 术 语 发 现 含 有 意料 之 外 的 意思 ， 不 是 现 有 的 可 以 学 习 的 。 我 们 可 以 着 
手 去 学 习 一 门 外 语 或 如 何 驾 驶 轿车 ， 但 是 可 能 发 现 那 些 任务 比 我 们 想象 得 更 加 困难 。 探 索 者 可 
能 会 发 现 一 个 大 湖 ， 而 目标 仅仅 是 学 习 了 解 那里 究竟 有 什么 。 开 发 具有 有 效 发 现 能 力 的 智能 体 
要 求 该 智能 体能 够 识别 潜在 的 富有 成 效 的 “思考 训练 ”。 这 里 ,发 现在 很 大 程度 上 依赖 推理 的 能 
力 以 及 启发 的 使 用 。 此 外 ， 许 多 用 于 发 现 的 应 用 经 常 要 求 智能 体能 够 区 别 有 意 义 的 结果 和 无 意 
义 的 结果 。 例 如 ， 一 个 数据 挖掘 智能 体 不 应 当 报告 所 发 现 的 每 一 个 微不足道 的 关系 。 

计算 机 发 现 系 统 中 成 功 的 例子 包括 以 哲学 家 弗朗西斯 。 培根 姻 士 命名 的 Bacon， 它 已 经 能 
发 现 (或 许 应 该 说 是 “重新 发 现 ”) 电学 上 的 欧姆 定律 、 行 星 运 动 的 开 普 勒 第 三 定律 ， 以 及 动量 
守恒 定律 。 系 统 AUTOCLASS 更 有 说 服 力 ， 它 采用 红外 光谱 数据 ， 已 经 发 现 了 目前 在 天 文学 上 
未 知 的 新 型 恒星 ， 这 是 由 计算 机 完成 的 一 个 真实 的 科学 发 现 。 


11.4.3 ”遗传 算法 


A* 算 法 ( 见 11.3 节 ) 可 寻找 许多 搜索 问题 的 最 优 解 ， 但 有 ， 一 些 问 题 因 其 太 过 复杂 无 法 通 
过 这 些 搜索 技术 求解 〈 执 行 起 来 超出 可 用 内 存 ， 或 者 无 法 在 合理 的 时 间 段 中 完成 )。 对 于 这 些 问 
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题 ， 有 时 可 以 通过 一 个 包含 多 级 试探 解 的 演进 过 程 获得 解 。 这 一 策略 是 遗传 算法 〈genetic 
algorithm ) 的 基础 。 从 本 质 上 来 说 ， 遗 传 算法 通过 随机 行为 模拟 繁殖 理论 和 自然 选择 的 进化 过 
程 来 求解 。 

遗传 算法 首先 生成 试探 解 的 一 个 随机 池 , 其 中 的 每 个 解 都 只 是 一 种 猜测 。( 对 于 八 数码 游戏 ， 
试探 解 可 以 是 方块 的 一 个 随机 移动 序列 。) 每 一 个 试探 解 称 为 一 个 染色 体 〈chromosome)， 而 构 
成 染色 体 的 每 个 独立 个 体 称 为 基因 (gene) 一 一 对 应 八 数码 游戏 中 的 一 次 方块 移动 。 

因为 每 个 初始 染色 体 都 是 一 个 随机 的 猜测 ， 所 以 它 不 太 可 能 表示 手头 问题 的 一 个 解 。 因 此 ， 
遗传 算法 会 生成 一 个 新 的 染色 体 池 ， 其 中 每 个 染色 体 是 上 一 个 池 中 两 个 染色 体 〈 父 母 ) 的 后 代 
(孩子 )。 这 些 父母 是 从 池 中 随机 选择 出 来 的 ， 而 这 个 池子 也 会 或 然 地 偏向 那些 似乎 最 有 可 能 生 
成 解 的 染色 体 ， 于 是 这 就 模拟 了 适 者 生存 的 进化 原则 。( 确 定 哪 些 染 色 体 是 最 佳 的 父母 伐 选 人 ， 
可 能 是 遗传 算法 过 程 中 最 困难 的 一 步 。) 每 个 后 代 都 是 父母 的 基因 随机 组 合 的 产物 。 此 外 ， 
最 终 的 后 代 偶 尔 可 能 以 某 种 随机 的 方式 变异 〈 如 交换 两 次 移动 )。 我 们 希望 ， 通 过 反复 重复 这 一 
过 程 ， 将 会 逐渐 演变 出 越 来 越 好 的 试探 解 ， 直 到 找 出 非常 好 的 〈 甚 至 是 最 佳 的 ) 试探 解 。 遗 憾 的 
是 ， 遗 传 算法 并 不 保证 最 终 一 定 能 够 找到 解 ， 但 研究 证 明 遗 传 算法 可 以 有 效 解决 种 类 繁多 的 复杂 
问题 。 

当 被 用 于 程序 开发 时 ， 使 用 遗传 算法 的 方法 称 为 进化 规划 〈evolutionary programming)。 此 
时 ， 我 们 的 目标 是 通过 模拟 进化 过 程 开发 程序 ， 而 不 是 直接 编写 程序 。 研 究 人 员 已 经 使 用 函数 
式 程序 设计 语言 将 进化 规划 技巧 应 用 于 程序 开发 过 程 。 运 用 这 个 方法 ， 首 先 要 建立 一 个 程序 的 
集合 ， 而 这 些 程序 包含 各 式 各 样 的 函数 。 初 始 集合 中 的 函数 构成 了 “基因 池 ?” 而 之 后 的 各 代 程 
序 将 通过 “基因 池 ” 来 构建 。 接 下 来 ， 我 们 可 以 允许 进化 过 程 展 开 并 延续 许多 代 ， 期 望 每 次 通 
过 上 一 代 中 的 最 佳 组 合生 成 新 的 一 代 ， 从 而 让 目标 问题 的 解决 方案 逐步 演进 。 


问题 与 练习 


1. 术语 真实 世界 的 知识 是 什么 意思 ? 它 在 人 工 智能 领域 有 何 重 要 意义 ? 

2. 一 个 关于 杂志 订阅 者 信息 的 数据 库 通常 包含 一 个 每 一 种 杂志 订阅 者 的 列表 ,但 是 不 包含 非 订阅 者 的 列 
表 。 那 么 ， 这 种 数据 库 如 何 判断 “个 人 没有 订阅 一 种 特定 的 杂志 ? 

3. 概述 框架 问题 。 

4. 给 出 训练 一 台 计 算 机 的 三 种 途径 ， 哪 一 种 没有 涉及 直接 的 人 为 于 预 ? 

5. 进化 技术 如 何 区 别 于 更 传统 的 问题 解决 技术 ? 
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即使 利用 人 工 智 能 所 取得 的 所 有 进展 ， 这 个 领域 里 的 许多 问题 仍然 使 得 使 用 传统 算法 的 计 
算 机 负担 沉重 。 指 令 序列 的 感知 和 推理 能 力 看 来 不 能 与 人 的 大 脑 相 匹 敌 。 由 于 这 个 原因 ， 许 多 
研究 者 的 目标 转向 了 利用 在 事物 本 质 中 观察 到 的 现象 的 方法 。 其 中 之 一 就 是 上 一 节 介绍 的 遗传 
算法 ， 另 一 种 方法 就 是 人 工 神经 网 络 。 


11.5.1 基本 特性 


人 工 神 经 网 络 提供 了 模仿 活体 生物 系统 中 神经 网 络 的 模型 。 一 个 生物 神经 元 是 单个 细胞 ， 
具有 一 些 称 为 树 突 的 输入 触角 和 一 个 称 作 轴 突 的 输出 触角 《〈 见 图 11-15)。 经 由 一 个 细胞 的 轴 突 
传递 的 信号 反映 了 细胞 是 处 于 抑制 状态 还 是 兴奋 状态 。 这 种 状态 由 细胞 的 树 突 接收 到 的 信和 号 的 
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组 合 来 决定 。 这 些 树 突 从 其 他 细胞 的 轴 突 通过 称 为 突 触 的 小 间隙 获得 信号 。 研 究 表明 ， 突 触 的 
传导 性 是 由 突 触 的 化 学 成 分 控制 的 。 也 就 是 说 ， 有 具体 的 输入 信号 将 对 神经 元 产生 兴奋 作用 还 是 
抑制 作用 由 突 触 的 化 学 成 分 决定 。 所 以 可 以 认为 ， 一 个 生物 神经 网 络 是 通过 调整 两 个 神经 元 之 
间 的 这 些 化 学 连接 来 学 习 的 。 


来 自 其 他 神 
We 





图 11-15 活体 生物 系统 中 的 一 个 神经 元 
人 工 神经 网 络 中 的 一 个 神经 元 是 模仿 对 生物 神经 元 这 种 基本 了 解 的 一 个 软件 单元 。 根 据 其 





有 效 输入 是 否 超 过 了 一 个 给 定 的 值 一 一 这 个 值 称 为 神经 元 的 阅 值 (threshold value) 产生 0 
或 1 作为 输出 。 如 图 11-16 所 示 ， 这 个 有 效 输入 是 许多 实际 输入 的 一 个 加 权 和 。 图 中 ， 神 经 元 由 
椭圆 表示 ， 两 个 神经 元 之 间 的 连接 由 箭头 表示 。 其 他 神经 元 〈 记 为 m、vwm 和 凡 ) 的 输出 用 作 所 描 
述 的 神经 元 的 输入 。 除 了 这 些 值 ， 每 个 连接 都 与 权 〈weight)〈 记 为 wj、Ww 和 wa3) 相关 联 。 神 经 
元 把 每 个 输入 值 与 相应 的 权 值 相 乘 ， 再 把 这 些 乘积 相 加 形成 有 效 输入 〈vnwi+vzwz+vaw3)。 如 果 
这 个 和 超过 该 神经 元 的 阔 值 ， 那 么 该 神经 元 就 产生 一 个 输出 值 1〈 模 拟 神经 元 的 兴奋 状态 ); 否 
则 就 产生 一 个 输出 值 0 (模拟 神 经 元 的 抑制 状态 )。 
Ml 神经 元 











计算 有 效 输入 : 











将 有 效 输 入 与 


产生 输出 0 或 1 
闵 值 进行 比较 
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图 11-16 ”一 个 神经 元 中 的 活动 


如 图 11-16 所 示 , 我 们 采用 圆 形 作为 表示 神经 元 的 约定 符号 ， 其 
中 每 个 输入 连接 一 个 神经 元 ， 并 在 圆 形 内 写 上 与 这 个 输入 相关 的 权 
值 ， 最 后 ， 在 大 圆 形 中 央 写 上 这 个 神经 元 的 阔 值 。 图 11-17 的 例子 表示 
了 一 个 有 3 个 输入 且 阔 值 为 1.5 的 神经 元 。 第 1 个 输入 的 权 值 为 -2， 第 2 
个 输入 的 权 值 为 3， 第 3 个 输入 的 权 值 为 -1。 因 此 ， 如 果 神 经 元 接收 的 
输入 分 别 为 1、1、0， 那 么 其 有 效 输入 为 (1)(-2)+(1)(3)+(0)(-D)=1， 所 以 
其 输出 为 0。 但 是 ， 如 果 神 经 元 接收 的 输入 分 别 为 0(、1、1， 那 么 其 
有 效 输入 为 (0)(-2)+(1)(3)+(1)(-1)=2， 超 出 了 阔 值 ， 所 以 神经 元 的 输出 为 1。 

权 值 可 以 是 正 值 ， 也 可 以 是 负 值 ， 这 一 事实 说 明 ， 相 应 的 输入 对 接收 神经 元 的 作用 可 以 是 





图 11-17 一 个 神经 元 的 表示 
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兴奋 或 是 抑制 。( 若 权 值 为 负 ， 接 收 的 输入 为 1 就 减少 了 加 权 和 ， 故 有 效 输入 倾向 低 于 阔 值 ， 相 
反 , 一 个 正 的 权 值 使 相应 输入 对 加 权 和 起 增加 作用 , 故 增加 了 加 权 和 超过 阔 值 的 机 会 。) 此 外 ， 
权 的 实际 大 小 控制 了 相应 输入 单元 对 接收 单元 起 抑制 作用 或 是 兴奋 作用 的 程度 。 因 此 ， 通 过 
调节 整个 人 工 神经 网 络 中 的 权 值 ， 我 们 就 能 够 对 网 络 编程 ， 以 预定 的 方式 对 不 同 的 输入 作出 
响应 。 

人 工 神经 网 络 通常 按 拓 扑 结构 分 层 排列 。 输 入 神经 元 位 于 第 一 层 ， 输 出 神经 元 位 于 最 后 一 
层 。 其 他 神经 元 层 〈 称 为 隐藏 层 ) 可 以 包含 在 输入 层 与 输出 层 之 间 。 一 个 层 中 的 每 个 神经 元 与 
随后 的 层 中 的 每 个 神经 元 互相 连接 。 图 11-18 给 出 了 一 个 简单 的 神经 网 络 的 例子 。 图 11-18a 编 程 
为 : 若 两 个 输入 不 同 ， 则 产生 输出 1， 否 则 输出 0。 但 如 果 改 变 权 值 如 图 11-18b 所 示 ， 那 么 这 个 
网 络 无 论 其 两 个 输入 都 是 1， 或 者 有 一 个 是 0， 其 响应 都 是 1。 

输入 隐藏 输出 





图 11-18 有 两 个 不 同 程序 的 神经 网 络 
我 们 应 当 注 意 ， 图 11-18 所 示 的 神经 网 络 布局 与 实际 的 生物 神经 网 络 相 比 实在 是 太 过 简单 。 
一 个 人 的 大 脑 大 约 包含 10" 个 神经 元 ， 每 个 神经 元 约 有 10“ 个 突 触 。 事 实 上 ， 一 个 生物 神经 元 的 
树 突 多 得 更 像 一 个 纤维 网 ， 而 不 像 图 11-15 中 所 表示 的 一 个 个 触角 。 


11.5.2 ”训练 人 工 神 经 网 络 


人 工 神经 网 络 的 一 个 重要 特征 是 ， 它 们 不 再 是 通过 传统 意义 上 的 编程 来 实现 ， 而 是 通过 训 
练 来 实现 。 也 就 是 说 ， 程 序 员 不 再 决定 解决 一 个 特定 问题 所 需 的 权 值 ， 并 把 这 些 值 “ 插 ” 入 网 
络 中 ; 相反， 是 由 人 工 神经 网 络 通过 监督 训练 学 习 获 得 合适 的 权 值 〈 见 11.4 节 )， 该 训练 是 一 个 
反复 的 过 程 ， 从 训练 装置 获得 的 输入 被 应 用 到 网 络 ， 然 后 用 小 的 增 量 调整 权 值 使 网 络 的 性 能 接 
近期 望 状态 。 

值得 一 提 的 是 ， 遗 传 算法 技巧 已 被 用 于 训练 人 工 神经 网 络 。 具 体 来 说 ， 要 训练 一 个 神经 网 
络 ， 网 络 的 一 些 权 集 可 以 自动 随机 生成 ， 其 中 每 一 个 权 集 用 作 遗 传 算法 的 一 个 染色 体 。 接 下 来 ， 
网 络 会 被 逐步 地 分 得 由 每 一 个 染色 体 表 示 的 权 值 ， 并 通过 各 种 输入 进行 测试 。 在 这 样 的 测试 过 
程 中 ， 生 成 错误 最 少 的 染色 体 更 有 可 能 被 选 为 下 一 代 染 色 体 的 父母 。 在 大 量 的 实验 中 ， 这 一 方 
法 最 终 都 会 生成 一 个 成 功 的 权 集 。 

来 看 这 样 一 个 例子 ， 假 设 成 功 地 训练 了 一 个 解决 某 一 问题 的 人 工 神经 网 络 ， 而 且 这 样 做 可 
能 比 尝试 通过 传统 程序 设计 技术 提供 一 个 解决 方案 更 具有 成 效 。 面 对 这 一 问题 的 可 能 是 一 个 机 
器 人 ， 它 通过 从 其 自身 摄像 头 接收 的 信息 理解 其 所 处 环境 。 例 如 ， 假 设 机 器 人 必须 区 分 一 个 房 
间 的 墙 面 (白色 ) 和 地 面 《 黑 色 )。 乍 一 看 ， 你 可 能 觉得 这 是 一 个 很 简单 的 任务 : 只 需 简 单 分 类 ， 
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将 白色 像素 归 为 墙 面 的 一 部 分 ， 将 黑色 像素 归 为 地 面 的 一 部 分 。 然 而 ， 当 机 器 人 从 不 同 的 方位 
观看 或 者 在 房间 中 走 来 走 去 时 ， 不 同 的 光线 条 件 有 时 会 使 墙 面 呈 现 灰色 ， 而 有 时 又 可 能 让 地 面 
呈现 灰色 。 因 此 ， 机 器 人 需要 学 习 如 何在 各 种 各 样 的 光线 条 件 下 区 分 墙 面 和 地 面 。 

为 此 ， 我 们 可 以 构建 这 样 一 个 人 工 神经 网 络 ， 其 中 输入 由 表明 图 像 中 单一 像素 颜色 特征 的 
值 和 表明 整个 图 像 的 总 亮度 的 值 组 成 。 构 建 完成 之 后 ， 我 们 可 以 为 它 提 供 表示 各 种 光线 条 件 下 
的 墙 面部 分 和 地 面部 分 的 像素 的 示例 ， 并 以 此 来 训练 这 一 网 络 。 

除了 简单 的 学 习 问 题 〈 如 像素 分 类 )， 人 工 神经 网 络 已 用 于 学 习 复 杂 的 智能 行为 ， 前 一 节 引 
用 的 ALVINN 项 目 就 是 一 例 。 实 际 上 ，ALVINN 是 一 个 人 工 神经 网 络 ， 如 图 11-19 所 示 ， 其 构成 
出 奇 地 简单 。ALVINN 从 30x32 阵 列 的 传感器 中 获得 输入 ， 每 个 传感器 负责 观察 前 面 道路 视频 图 
像 的 一 个 特定 部 分 ， 并 且 向 隐蔽 8 层 的 4 个 神经 元 的 每 一 个 报告 其 发 现 。( 从 而 ， 这 4 个 神经 元 中 每 
一 个 都 有 960 个 输入 。) 这 4 个 神经 元 中 每 一 个 的 输出 都 与 30 个 输出 神经 元 的 每 一 个 相连 接 ， 其 输 
出 指明 了 驾驶 的 方向 。 这 30 个 神经 元 形成 一 行 ， 一 端 处 于 兴奋 的 神经 元 表示 向 左 急 转弯 ， 而 另 
一 端 处 于 兴奋 的 神经 元 则 表示 向 右 急 转弯 。 


问 左 急 转 弯 直行 向 右 急 转弯 





30x32 的 道路 图 像 


图 11-19 ALVINN 的 结构 


ALVINN 的 训练 是 通过 “观察 ”一 个 人 的 驾驶 进行 的 。 当 要 做 出 自己 的 驾驶 决定 时 ， 它 把 
自己 的 决定 与 人 的 决定 进行 比较 ， 并 且 稍微 修改 其 权 值 使 其 更 接近 人 的 决定 。 然 而 ， 存 在 一 个 
有 意思 问题 ， 尽 管 ALVINN 通 过 这 个 简单 的 技术 学 习 了 驾驶 ， 但 是 它 没 有 学 习 如 何 从 错误 中 恢 
复 过 来 。 因此 ， 从 人 那里 收集 的 数据 也 要 人 为 加 强 恢复 状态 。( 最 初 考虑 的 恢复 训练 的 一 种 方法 
是 使 人 令 交 通 工 具 偏 离 方向 ， 以 便 ALVINN 可 以 通过 观察 人 来 学 习 如 何 恢复 。 但 在 人 进行 初始 
的 偏离 过 程 时 应 该 让 ALVINN 关 闭 ， 否 则 ,，ALVINN 除 了 恢复 也 会 学 会 偏离 一 一 这 显然 不 是 一 个 
受 欢 迎 的 特性 。) 
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11.5.3 ”联想 记忆 


人 脑 具 有 惊人 的 能 力 ， 能 够 从 当前 关心 的 情景 中 提取 出 与 之 关联 的 信息 。 当 闻 到 特定 气味 
时 ， 我 们 很 容易 勾 起 对 儿 时 的 回忆 ; 朋友 的 声音 会 唤起 友人 的 身影 和 一 段 美好 时 光 的 回忆 ; 特 
定 的 音乐 可 能 会 产生 对 某 些 假 日 的 怀念 。 这 些 就 是 联想 记忆 (associative memory) 一 一 提取 与 
手头 信息 相关 的 信息 。 

构建 具有 这 种 联想 记忆 能 力 的 机 器 是 许多 年 来 的 一 个 研究 目标 。 途 径 之 一 是 应 用 人 工 神经 
网 络 技术 。 例 如 ， 考 虑 一 个 由 许多 神经 元 组 成 的 网 络 ， 这 些 神经 元 相互 连接 形成 一 个 没有 输入 
和 输出 的 网 。[ 有 些 设 计 中 ， 每 一 个 神经 元 的 输出 都 连 到 每 个 其 他 神经 元 ， 作 为 这 些 神经 元 的 输 
入 ， 这 种 设计 称 为 霍 普 菲 尔 德 网 络 (Hopfield network); 在 有 些 设计 中 ， 一 个 神经 元 的 输出 可 能 
只 连 到 与 其 直接 相 邻 的 神经 元 。] 在 这 样 的 系统 中 ， 处 于 兴奋 状态 的 神经 元 将 会 使 其 他 神经 元 进 
入 兴奋 状态 ， 而 处 于 抑制 状态 的 神经 元 将 会 使 其 他 神经 元 进入 抑制 状态 。 因 此 ， 整 个 系统 可 能 
会 处 于 不 断 发 生变 化 的 状态 中 ， 也 可 能 会 找到 办 法 实现 稳定 格局 〈 其 中 ， 处 于 兴奋 状态 下 的 神 
经 元 会 保持 兴奋 状态 ， 而 处 于 抑制 状态 下 的 神经 元 会 保持 抑制 状态 )。 如 果 以 一 个 接近 某 一 稳定 
格局 的 不 稳定 格局 启动 网 络 ， 我 们 可 以 期 望 它 进 入 稳定 格局 。 从 某 种 意义 上 说 ， 当 给 定 一 个 稳 
定格 局 的 一 部 分 ， 网 络 可 能 能 够 完成 这 一 格局 。 

现在 假设 我 们 用 1 表示 一 个 活跃 状态 ，0 表 示 抑 制 状 态 ， 这 样 任何 时 刻 的 整个 网 络 的 状态 都 
能 被 想象 成 0 和 1 的 布局 。 然 后 ， 如 果 把 网 络 设置 为 一 个 接近 稳定 模式 的 位 模式 ， 我 们 就 可 以 期 
望 网 络 转换 到 稳定 模式 。 换 言 之 ， 网 络 可 能 找到 接近 赋予 它 的 模式 的 稳定 位 模式 。 所 以 ， 如 果 
一 些 位 用 来 编码 成 “气味 ”， 男 一 些 位 用 来 编码 成 “ 儿 时 回忆 ”， 那 么 ， 根 据 某 个 稳定 布局 初 设 
的 “气味 ”位 ， 就 能 够 使 其 余 的 位 找到 关联 的 “ 儿 时 回忆 ”。 

现在 我 们 考虑 图 11-20 所 示 的 人 工 神 经 网 络 。 遵 照 用 于 描述 人 工 神 经 网 络 的 约定 ， 图 中 
每 个 圆圈 代表 一 个 神经 元 ， 其 阔 值 记 于 圆 中 。 连 接 圆圈 的 线 〈 而 不 是 箭头 ) 代表 两 个 相应 神 
经 元 之 间 的 双向 连接 。 也 就 是 说 , 一 条 连接 两 个 神经 元 的 线 表示 每 个 神经 元 的 输出 连 到 另 一 
个 神经 元 作为 输入 。 因 此 ， 中 央 神 经 元 的 输出 连 到 其 周边 每 个 神经 元 作为 输入 ， 而 周边 每 个 
神经 元 的 输出 既 连 到 中 央 的 神经 元 作为 输入 又 连接 到 其 周边 与 其 相 邻 的 每 一 个 神经 元 作为 
输入 。 两 个 相连 的 神经 元 相互 的 输出 都 有 相同 的 权 值 。 这 个 共同 的 权 值 记 在 连接 线 旁 边 。 于 
是 ,图 中 顶部 那个 神经 元 从 中 央 神 经 元 接收 的 输入 伴 有 权 值 -1， 从 其 两 个 周边 邻居 接收 到 的 
输入 伴 有 权 值 1。 类 似 地 ， 中 央 神 经 元 从 周边 各 神经 元 接收 的 输入 伴 有 权 值 -1。 

网 络 以 独立 的 步骤 运转 ， 每 一 步 ， 所 有 的 神经 元 都 以 同步 方式 对 其 输入 作出 响应 。 为 了 从 
网 络 的 当前 布局 确定 其 下 一 步 布 局 ， 我 们 要 确定 整个 网 络 中 每 一 个 神经 元 的 有 效 输 入 ， 再 让 所 
有 的 神经 元 同时 响应 其 输入 。 结 果 ， 整 个 网 络 遵循 一 个 协调 的 顺序 运作 : 计算 有 效 输入 ， 响 应 
输入 ， 计 算 有 效 输入 ， 响 应 输入 ， 等 等 。 如 果 我 们 将 网 络 最 右边 的 两 个 神经 元 初始 化 为 抑制 状 
态 ， 将 其 他 神经 元 初始 化 为 兴奋 状态 〈 见 图 11-21a)， 那 么 我 们 来 考虑 会 发 生 哪 些 事件 。 最 左边 
两 个 神经 元 的 有 效 输入 都 为 1， 所 以 它们 保持 兴奋 ;但 它们 周边 邻居 的 有 效 输入 为 0， 所 以 会 变 
成 抑制 状态 。 类 似 地 ， 中 央 神 经 元 的 有 效 输入 为 -4， 所 以 变 为 抑制 状态 。 于 是 ， 整 个 网 络 转变 
成 图 11-21b 所 示 的 布局 ， 只 有 最 左边 两 个 神 元 处 于 兴奋 状态 。 因 为 中 央 神 经 元 现在 为 抑制 状态 ， 
所 以 最 左边 两 个 神经 元 的 兴奋 状态 将 导致 顶部 和 底部 两 个 神经 元 再 次 变 成 兴奋 状态 。 同 时 ， 因 
为 有 效 输入 为 -2， 中 央 神 经 元 继续 保持 抑制 状态 。 于 是 网 络 转 变 成 图 11-21c 所 示 的 布局 ， 然 后 
它 又 导致 了 图 11-21d 所 示 的 布局 。( 如 果 将 网 络 初 始 化 为 只 有 上 面 4 个 神经 元 为 兴奋 状态 ， 那 么 
会 出 现 一 种 闪烁 现象 。 顶 部 神经 元 保持 兴奋 ， 而 其 2 个 周边 邻居 及 中 央 神 经 元 会 在 兴奋 与 抑制 两 
种 状态 间 不 断 切 换 。) 
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开始 : 除 最 右边 的 单元 外 ie 
en 
步骤 2: ee 最后: 所 有 边界 单 
元 都 兴奋 
ts (d) 
图 11-20 ”实现 联想 记忆 的 一 个 人 工 神经 网 络 ， 图 11-21 导向 稳定 布局 的 步骤 


最 后 ， 我 们 观察 到 这 个 网 络 有 两 种 稳定 布局 : 一 种 是 中 央 神 经 元 处 于 兴奋 状态 ， 而 其 他 神 
经 元 处 于 抑制 状态 ; 另 一 种 是 中 央 神 经 元 处 于 抑制 状态 ， 而 其 他 神经 元 处 于 兴奋 状态 。 如 果 我 
们 将 网 络 初 始 化 为 中 央 神 经 元 兴奋 而 其 他 处 于 兴奋 状态 的 神经 元 不 超过 两 个 ， 那 么 网 络 会 走向 
前 一 种 稳定 布局 。 如 果 我 们 将 网 络 初始 化 为 至 少 4 个 相 邻 周边 神经 元 处 于 兴奋 状态 , 那么 网 络 会 
走向 后 一 种 稳定 布局 。 所 以 可 以 说 ， 这 种 网 络 ， 如 果 初 始 模式 为 中 央 神 经 元 及 3 个 以 下 周边 神经 
元 处 于 兴奋 状态 ， 就 与 前 一 种 稳定 布局 相关 联 ， 如 果 初 始 模式 为 4 个 或 4 个 以 上 周边 神经 元 处 于 
兴奋 状态 ， 那 么 就 与 后 一 种 稳定 布局 相关 联 。 简 单 来 说 ， 这 个 网 络 表示 基本 的 联想 记忆 。 
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11.6 ”机 器 人 学 


机 器 人 学 (robotics) 是 研究 具有 智能 行为 的 物理 上 的 自主 智能 体 的 一 门 学 科 。 对 于 所 有 的 
智能 体 ， 机 器 人 在 所 处 的 环境 中 必须 能 够 感知 、 推 理 和 发 生 作 用 。 因 此 ， 机 器 人 学 涵盖 了 人 工 
智能 的 所 有 研究 范围 ， 并 借鉴 了 很 多 机 械 和 电子 工程 方面 的 知识 。 

机 器 人 需要 用 机 械 装置 来 回 移动 和 操作 目标 物体 来 与 外 界 交 互 。 在 早期 的 机 器 人 学 中 ， 该 
领域 与 操作 器 的 发 展 联系 紧密 ， 这 些 操作 器 通常 是 带 有 肘 、 腕 及 手 或 工具 的 机 械 臂 。 研 究 不 仅 
涉及 这 样 的 装置 如 何 操作 , 而 且 涉 及 如 何 维护 和 应 用 有 关 它 们 的 位 置 和 方向 的 知识 。( 你 闭 上 了 眼 
睛 也 能 够 用 手 摸 到 自己 的 段子 , 因为 你 的 大 脑 保存 有 鼻子 和 手指 在 什么 地 方 的 记录 。) 随 着 时 间 
的 推移 ， 机 械 臂 已 经 能 够 更 灵巧 地 定位 ， 使 用 基于 力 反 馈 的 触觉 ， 机 械 臂 能 够 成 功 地 握 住 鸡蛋 
和 纸杯 。 

最 近 ， 更 快速 、 更 轻便 的 计算 机 的 发 展 促进 了 移动 机 器 人 方面 更 重大 的 研究 。 这 种 灵活 性 
导致 了 大 量 富 有 创意 的 设计 。 在 机 器 人 移动 能 力 方面 ， 研 究 人 员 已 经 开发 出 可 以 像 鱼 一 样 游 动 
的 机 器 人 、 像 晴 凤 一 样 飞翔 的 机 器 人 、 像 蝗虫 一 样 跳跃 的 机 器 人 ， 以 及 像 蛇 一 样 蚁 蜂 息 行 的 机 
器 大 ， 

因为 带 有 轮子 的 机 器 人 相对 容易 设计 和 建造 ,所 以 非常 受 欢 迎 , 但 是 它 会 受 地 形 的 限制 。 
结合 使 用 轮子 和 导轨 ， 克 服 这 种 限制 ， 使 机 器 人 能 够 仆 楼 梯 或 翻越 岩石 是 当前 的 研究 目标 。 
例如 ，NASA (美国 国家 航空 航天 局 ) 的 “火星 漫游 者 ”(Mars rover) 就 是 使 用 特殊 设计 的 
轮子 在 火星 的 岩石 屋 上 行走 。 

有 腿 的 机 器 人 其 可 移动 性 大 大 提高 ， 但 是 相当 复杂 。 例 如 ， 设 计 能 像 人 一 样 行走 的 两 条 腿 
机 器 人 必须 持续 地 监视 和 调整 其 姿态 ， 否 则 它 会 跌倒 。 但 是 ， 这 种 困难 能 够 克服 ， 例 如 ， 本 田 
公司 开发 的 两 条 腿 的 具有 人 类 特征 的 机 器 人 Asimo， 能 够 上 楼 梯 ， 甚 至 能 够 跑 。 

尽管 在 操作 器 和 移动 能 力 方 面 取 得 了 巨大 的 进步 , 但 是 大 多 数 机 器 人 仍然 不 是 非常 自主 的 。 
通常 工业 机 械 臂 是 为 每 个 任务 通过 严格 编程 设计 出 来 的 ， 工 作 时 不 用 传感器 ， 它 假设 零件 将 会 
按照 指定 的 位 置 精确 地 传送 给 它们 。 其 他 的 移动 机 器 人 ， 如 NASA 的 “火星 漫游 者 ”和 军用 无 
人 机 (Unmanned Aerial Vehicle，UAV)， 其 智能 都 是 依靠 人 的 操作 来 实现 的 。 

克服 这 种 对 人 的 依赖 是 当前 研究 的 一 个 主要 目标 。 问 题 涉及 一 个 自主 的 机 器 人 需要 知道 关 
于 其 所 处 环境 的 哪些 知识 ， 以 及 需要 预先 计划 其 行为 到 什么 程度 。 一 种 方法 是 建造 能 维持 所 处 
环境 详细 记录 的 机 器 人 ， 该 记录 包含 目标 物体 的 详细 目录 以 及 它们 的 方位 ， 通 过 这 些 信息 ， 机 
器 人 能 够 制定 详细 的 行动 计划 。 这 个 方向 的 研究 很 大 程度 上 依靠 知识 表示 和 知识 存储 方面 取得 
的 进展 以 及 推理 和 规划 技术 的 改进 。 

另 一 个 可 选择 的 方法 是 开发 反应 型 机 器 人 ， 该 方法 不 用 保持 复杂 的 记录 ， 也 不 用 耗费 精力 
去 构建 详细 的 行动 计划 ， 只 要 应 用 简单 的 与 外 界 交互 的 规则 时 时 刻 刻 指导 它们 的 行为 即 可 。 反 
应 型 机 器 人 技术 的 支持 者 认为 : 当 计 划一 个 长 途 汽车 旅行 时 ， 人 们 不 会 预先 制定 全 面 而 详细 的 
计划 ， 相 反 ， 他 们 仅 是 选择 主要 路 线 ， 而 对 于 像 到 哪 吃 饭 、 走 哪些 出 口 ， 以 及 如 何 绕道 行驶 等 
细节 则 到 时 候 再 考虑 。 同 样 ， 一 个 反应 型 机 器 人 若 要 通过 一 条 拥挤 的 走 底 ， 或 从 一 栋 大 楼 走 到 
另 一 栋 大 楼 ， 也 不 会 预先 制定 非常 详细 的 计划 ， 但 是 当 碰 到 障碍 时 ， 它 会 应 用 简单 的 规则 避 开 。 
这 是 历史 上 最 畅销 的 机 器 人 一 一 iRobot Roomba 真 空 吸尘器 所 采用 的 方法 ,真空 吸尘器 以 反应 模 
式 在 地 面 上 来 回 移 动 ， 而 不 会 为 记 住家 具 的 详细 信息 和 其 他 障碍 而 费心 。 毕 竟 ， 这 次 碰 到 的 家 
庭 宠物 下 次 不 可 能 还 采 在 同一 个 地 方 。 
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当然 , 单一 的 方法 并 不 是 对 于 所 有 情况 都 是 最 好 的 。 真正 的 自主 机 器 人 最 有 可 能 使 用 多 
层 标准 的 推理 和 计划 , 应 用 高 级 技术 设 定 和 达到 主要 目标 , 应 用 较 低级 的 反应 系统 完成 次 要 
子 目 标 。 这 种 多 层次 推理 的 例子 可 在 RoboCup 比 赛 〈 一 个 机 器 人 足球 队 的 国际 性 比赛 ) 中 发 
现 ， 人 们 力图 在 2050 年 开发 出 能 够 对 抗 世 界 级 人 类 足球 队 的 机 器 人 足球 队 。 这 里 ， 重 点 不 
仅 是 建造 能 够 “ 踢 ” 球 的 移动 计算 机 ， 而 是 设计 一 个 能 够 相互 协作 达到 共同 目标 的 机 器 人 足 
球 队 。 这 些 机 器 人 不 仅 要 移动 和 对 自己 的 行为 做 出 推断 , 而 且 还 要 对 队友 和 对 手 的 行为 作出 
推断 。 

机 器 人 学 研究 领域 的 另 一 个 例子 是 进化 机 器 人 学 ， 该 领域 把 进化 理论 应 用 于 开发 低级 反应 
规则 所 对 应 的 方案 和 开发 高 级 推理 所 对 应 的 方案 。 这 里 我 们 发 现 ， 适 者 生存 理论 用 到 了 设备 的 
开发 上 ， 经 过 若干 代 的 学 习 ， 这 些 设 备 已 经 能 够 自己 获得 平衡 或 移动 的 方法 。 这 个 领域 的 许多 
研究 各 有 侧重 ， 其 不 同 之 处 在 于 机 器 人 的 内 部 控制 系统 〈 很 大 程度 上 是 软件 ) 及 其 形体 的 物理 
结构 。 例 如 ， 把 一 个 能 游泳 的 曙 昱 机 器 人 的 控制 系统 换 在 一 个 有 腿 的 类 似 机 器 人 身上 ， 然 后 在 
控制 系统 中 应 用 进化 技术 ， 就 得 到 一 个 能 息 行 的 机 器 人 。 还 有 一 些 例子 中 ， 进 化 技术 已 经 被 应 
用 在 机 器 人 的 物理 形体 上 ， 让 传感器 发 现 执行 特定 任务 的 最 佳 位 置 。 更 具 挑 战 性 的 研究 正在 寻 
求 软件 控制 系统 与 形态 结构 同时 发 展 的 途径 。 

机 器 人 学 的 研究 成 果 很 多 都 令 人 难忘 ， 这 方面 的 例子 举 不 胜 举 。 当 前 的 机 器 人 与 科幻 电影 
和 小 说 中 的 超 能 机 器 人 相差 甚 远 ， 但 是 在 执行 特定 任务 上 已 经 取得 了 重大 成 功 。 机 器 人 已 经 能 
够 驾驶 交通 工具 ， 模 仿 宠物 狗 的 行为 举止 ， 或 者 为 武器 导航 。 然 而 ， 享 受 这 些 成 功 的 同时 ， 我 
们 应 该 注意 ， 对 人 造 宠物 狗 的 钟情 以 及 智能 武器 的 可 怕 威 力 带 来 了 社会 问题 和 道德 问题 ， 这 些 
都 癌 社会 发 出 了 挑战 。 我 们 的 未 来 是 我 们 自己 造就 的 。 






: nl DAE 

(a) 两 个 机 器 人 足球 队 于 2013 年 4 月 26 日 在 德国 马 格 德 堡 举办 的 2013 机 器 人 世界 杯 德国 公开 
赛 中 踢 足 球 ( Jens Schlueter/Stringer/GettyImages ).(b )Tartan Racing 团 队 的 赛车 “Boss” 一 一 DARPA 
举办 的 无 人 驾驶 汽车 城市 挑战 赛 Urban Challenge 的 大 奖 得 主 (© DARPA )。(c) NASA 的 一 台 温 游 
者 台 探 测 火星 表面 地 质 情况 的 机 器 人 ( Courtesy NASA/JPL-Caltech )。 
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问题 与 练习 
1. 对 于 机 器 人 行为 的 反应 方法 在 何 种 方式 上 有 别 于 更 传统 的 “基于 计划 ”的 行为 ? 


2. 当前 机 器 人 学 领域 研究 的 主题 有 哪些 ? 
3. 进化 理论 用 在 机 器 人 开发 的 哪 两 个 层次 ? 


一 be pe a = PE ET 


毫 无 疑问 ， 人 工 智 能 领域 取得 的 进步 可 能 会 造福 和 人 类， 人们 很 容易 热衷 于 这 些 潜 在 的 好 处 。 
然而 ， 这 也 为 将 来 留 下 了 后 患 ， 它 的 破坏 性 后 果 与 其 带 来 的 好 处 同样 巨大 。 这 种 差异 常常 仅 在 
于 一 个 人 的 观点 或 一 个 人 的 社会 地 位 的 不 同一 一 彼 之 所 得 ， 此 之 所 失 。 所 以 花 一 点 时 间 从 另外 
一 个 角度 观察 正在 进步 的 技术 对 于 我 们 来 说 是 比较 恰当 的 。 

有 些 人 把 技术 的 进步 看 成 是 给 与 人 类 的 一 份 厚礼 一 一 将 人 类 从 枯燥 的 、 普 通 的 任务 中 解放 
出 来 ， 为 更 愉悦 的 生活 方式 打开 大 门 。 但 对 于 同一 个 现象 ， 男 一 些 人 则 把 它 看 作 是 剥夺 公民 就 
业 机 会 、 把 财富 引 疝 权势 人 物 的 祸根 。 其 实 , 这 正 是 印度 忠诚 的 人 道 主 义 者 圣 雄 甘地 所 预言 的 。 
甘地 再 三 地 辩 称 ， 如 果 用 农夫 家 庭 手 纺 车 来 代替 大 型 纺织 工厂 ， 那 么 印度 人 的 生活 将 会 变 得 更 
好 。 他 断言 ， 通 过 这 个 途径 ， 可 以 用 一 个 分 散 的 大 宗 生 产 系 统 取代 只 能 雇用 少数 人 的 集中 式 大 
宗 生 产 ， 这 将 有 利于 平民 大 众 。 

历史 上 有 很 多 因 财 富 和 权力 分 配 不 均 而 引起 的 革命 。 如 果 今 天 正在 进步 的 技术 加 固 了 这 种 
差异 ， 那 将 产生 灾难 性 的 后 果 。 

但 是 ， 建 造 越 来 越 智能 的 机 器 的 后 果 ， 比 对 付 不 同 社会 族群 间 的 权力 斗争 的 后 果 更 加 微 
妙 ， 也 更 加 根本 。 这 些 问题 触及 了 人 类 自身 形象 的 核心 。19 世 纪 ， 查 尔 斯 。 达尔 文 的 进化 论 及 
人 类 可 能 由 更 低 等 的 生命 形式 进化 而 来 的 想法 震惊 了 整个 社会 。 那 么 ， 面 对 机 器 的 智力 向 人 类 
智力 挑战 的 冲击 ， 社 会 将 如 何 反应 呢 ? 

过 去 ， 技 术 发 展 缓慢 ， 有 时 间 让 我 们 重新 调整 智能 的 概念 ， 维 护 人 类 自身 形象 。19 世 纪 ， 
我 们 的 老 祖宗 会 认为 当时 的 机 械 装置 具有 超自然 的 能 力 ， 而 今天 我 们 决 不 会 认为 这 些 机 械 有 什 
么 智能 。 但 是 ， 如 果 机 器 真 的 挑战 了 人 类 的 智能 ， 或 者 更 有 可 能 的 是 ， 机 器 能 力 的 进步 远 远 超 
过 了 我 们 的 适应 能 力 ， 那 么 人 类 将 如 何 应 对 呢 ? 

考虑 一 下 20 世 纪 中 叶 社 会 对 当时 IQ 测 试 的 反响 ， 也 许可 以 从 中 得 到 一 些 线索 ， 看 看 人 类 面 
对 挑战 我 们 智能 的 机 器 时 的 可 能 反应 。 这 些 测试 可 用 来 确定 孩童 的 智力 水 平 。 美 国 常常 依据 孩 
童 们 在 测试 中 的 表现 来 对 他 们 进行 分 类 ， 并 据 此 将 他 们 纳入 相应 的 教育 计划 。 反 过 来 ， 只 向 那 
些 在 测试 中 表现 良好 的 孩子 开放 受 教育 的 机 会 ， 而 安排 那些 测试 表现 差 的 孩子 去 参加 补习 。 简 
而 言 之 ， 当 给 出 一 种 衡量 个 体 智能 的 标准 时 ， 社 会 会 倾向 于 漠视 被 认为 是 低 于 这 个 标准 的 那些 
人 的 能 力 。 那 么 ， 如 果 机 器 的 “智能 ”能 力 已 经 变 得 可 与 人 类 相 匹敌 ， 甚 至 只 是 看 上 去 可 以 相 
匹敌 ， 社 会 将 怎样 应 对 这 种 局 面 呢 ? 抑或 社会 也 漠视 那些 能 力 看 上 去 “不 如 ”机 器 的 人 ? 如 果 
这 样 ， 对 于 社会 的 这 些 成 员 来 说 ， 后 果 是 什么 ? 难道 一 个 人 的 尊严 会 受 他 与 机 器 的 比较 结果 的 
影响 吗 ? 

我 们 已 经 看 到 ， 在 一 些 特定 场合 ， 人 类 的 智力 正面 临 机 器 的 挑战 。 机 器 现在 有 能 力 打败 棋 
王 ; 计算 机 化 的 专家 系统 能 够 给 出 治疗 意见 ;管理 证 券 投 资 的 简单 程序 常常 比 投资 专家 做 得 更 
好 。 这 样 的 系统 是 怎样 影响 所 涉及 人 员 的 自我 形象 的 ? 随 着 在 越 来 越 多 的 领域 里 机 器 的 表现 优 
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于 人 类 ， 个 人 的 自尊 心 会 受到 怎样 的 影响 ? 

由 于 人 是 生物 ， 而 机 器 不 是 ， 所 以 许多 人 认为 机 器 拥有 的 智能 与 人 类 的 智能 有 着 本 质 的 区 
别 。 因 此 ， 他 们 认为 ， 机 器 永远 不 会 再 生出 人 类 的 决策 过 程 。 机 器 也 许 会 得 到 与 人 同样 的 结论 ， 
但 是 得 到 这 些 结论 所 依赖 的 基础 与 人 类 并 不 相同 。 那 么 在 怎样 的 程度 上 存在 不 同类 型 的 智能 ? 
对 于 社会 来 说 ， 如 果 按 照 非 人 类 智能 的 “思维 ”方式 来 发 展 ， 是 否 合乎 道德 ? 

Joseph Weizenbaum 在 他 的 Computer Power and Human Reason 一 书 中 坚决 反对 不 加 抑制 地 
应 用 人 工 智 能 ， 他 这 样 写 道 : 

计算 机 能 够 作出 司法 判决 ， 计 算 机 能 够 作出 精神 病 判 定 。 它 们 能 够 以 比 最 有 耐心 
的 人 更 加 老练 的 方式 投掷 硬币 。 关 键 在 于 不 应 当 给 它们 这 些 任务 。 在 某 些 场合 ， 它 们 





甚至 能 够 得 到 总 是 而 且 一 定 不 是 人 类 所 乐于 接 
受 的 。 

村 人 省 关 “计生 机 和 大 且 ”的 剖 作 三 二 在 这 用 的 竺 从 渤 ; 问题 的 笑 夺 不 奉 
于 技术 ， 甚 至 也 不 在 于 数学 ， 而 在 于 道德 。 设 定 计算 机 去 做 什么 ， 不 能 用 “能 够 不 能 


够 ”这 样 的 问题 ， 计 算 机 适用 性 的 限制 最 终 只 能 根据 “应 当 ” 来 表达 。 最 基本 的 认识 
应 该 是 : 因为 我 们 现在 还 没有 办 法 让 计算 机 有 智慧 ， 所 以 我 们 现在 就 不 应 当 让 计算 机 
去 做 有 智慧 的 工作 。 


也 许 你 会 认为 本 节 所 述 的 许多 内 容 近 乎 科幻 小 说 ， 而 不 是 计算 机 科学 。 就 在 不 久 前 ， 许 多 
人 因 抱 有 同样 的 “这 永远 不 会 发 生 ” 的 态度 ， 而 拒绝 考虑 “如 果 计 算 机 操纵 了 社会 ， 会 发 生 什 
么 ? ”。 但 从 许多 方面 来 看 ,这 一 天 现在 已 经 来 临 。 如 果 一 个 计算 机 化 的 数据 库 错 报 了 你 有 不 良 
的 信用 度 、 有 犯罪 记录 或 是 银行 账户 透支 ， 那 么 ， 是 计算 机 的 报告 会 奏效 还 是 你 自己 的 清白 申 
诉 会 奏效 ? 如 果 一 个 不 正常 的 导航 系统 错误 指示 了 大 雾 笼 单 的 跑道 位 置 ， 那 么 飞机 将 降落 在 何 
处 ? 如 果 一 个 机 器 用 来 预测 公众 对 不 同 政治 决策 的 反应 ， 那 么 一 个 政治 家 应 采取 何 种 决策 ? 你 
遇 到 过 多 少 次 因为 “计算 机 坏 了 ”所 以 服务 员 无 法 为 你 服务 的 情形 ? 那么， 究竟 谁 〈 或 什么 ) 
掌管 着 这 个 社会 ? 我 们 还 没有 准备 让 社会 届 从 于 机 器 吗 ? 


问 是 与 练习 


1 如 时 过去 100 全 来 人 的 所 有 机 呈 帮 去 拉 ， 于 和 今天 的 人 还 有 多 人 能 在? 如果 是 过 去 0 年? 20 
年 呢 ? 幸存 者 会 在 何 处 ? i 

你 生活 在 多 大 和 度 上 被 机 所 毕 和 ? 认 叉 科 过 此 出 你 生活 的 机 
3, 你 从 哪里 获得 那些 作为 你 的 日 党 决策 基础 的 信息 ? 对 于 你 的 重大 次 策 呢 ? 对 这 些 信息 的 准确 度 你 有 
。 多 少 把 握 ? 为 什么 ? 





ee 








复习 题 
〈 带 * 的 题目 涉及 选读 章节 的 内 容 。) 下 分 析 : 它 的 传感器 是 什么 ? 它 的 效应 器 是 什 
1. 正如 11.2 节 说 明 的 那样 ， 人 类 会 用 一 个 问题 来 么 ? 它 可 以 展现 什么 级 别 的 反应 (反射 性 反 
表达 某 个 目的 , 而 不 是 提问 。 另 一 个 例子 “你 应 、 基 于 知识 的 反应 或 基于 目标 的 反应 ) ? 
知道 你 的 轮胎 漏 气 了 吗 ?”， 这 也 是 用 来 提醒 3. 确定 下 列 每 一 个 反应 ， 是 反射 性 反应 、 基 于 
而 不 是 问 。 给 出 一 些 用 来 表达 安慰 、 警 告 或 责 知识 的 反应 还 是 基于 目标 的 反应 。 证 明 你 的 
备 的 问题 的 例子 。 回答 


2. 把 一 个 汽水 分 配 机 当 作 一 个 智能 体 来 进行 如 a. 一 个 计算 机 程序 把 文本 从 德 文 翻译 成 英文 。 


全 


un 


玉 


CN 


一 ] 


下] 人 


b. 当 室内 温度 低 于 当前 设 定 值 时 ， 恒 温 器 打 
开 暖气 。 
c. 一 位 飞行 员 驾 驶 飞机 安全 地 在 跑道 上 着 陆 。 


. 如 果 一 个 研究 人 员 使 用 计算 机 模型 来 研究 人 


脑 的 记忆 能 力 , 那么 为 机 器 所 开发 的 程序 必定 
要 达到 机 器 的 最 佳 存 储 能 力 吗 ? 请 解释 。 


. 举 出 几 个 陈述 性 知识 的 例子 。 举 出 几 个 过 程 性 


知识 的 例子 。 


. 在 面向 对 象 程序 设计 的 环境 中 ， 一 个 对 象 的 哪 


些 部 分 用 来 存储 陈述 性 知识 ?哪些 部 分 用 来 存 
储 过 程 性 知识 ? 


. 下 列 活动 中 , 你 认为 哪些 是 面向 性 能 的 ?哪些 


是 面向 模拟 的 ? 

a. 一 个 自动 往返 系统 的 设计 (通常 用 在 机 场 
两 个 航 站 楼 之 间 )。 

. 用 于 预测 台风 路 径 的 模型 的 设计 。 

c. 一 个 用 于 提取 和 维护 万 维 网 上 存储 的 文档 
目录 的 Web 搜 索 数 据 库 的 设计 。 

d. 一 个 用 于 测试 理论 的 国家 经 济 模型 的 设计 。 

e. 一 个 用 于 监视 病人 生命 体征 的 程序 的 设计 。 


[= 


. 当今 , 某 些 打 给 企业 的 电话 由 自动 应 答 系统 


来 处 理 , 该 系统 利用 语音 识别 与 打 电 话 的 人 
进行 通话 。 这些 系统 通过 了 图 灵 测 试 吗 ? 请 
解释 你 的 答案 。 


. 确定 能 用 来 区 分 符号 F、E、L 和 T 的 一 组 几何 


特征 。 

请 描述 通过 与 模板 比较 鉴别 特性 的 技术 与 第 1 
章 介绍 的 利用 纠 错 码 鉴定 特性 的 技术 之 间 的 
相似 之 处 。 


. 根据 下 面 线 绘图 中 标记 A 的 那个 角 是 凸 起 还 


是 凹 下， 说明 这 个 图 的 两 种 解读 。 


A 


. 比较 下 列 两 个 句子 中 介词 短语 的 作用 ( 仅 有 一 


个 词 不 同 )。 如 何 对 一 台 机 器 编程 让 它 做 这 样 
的 区 分 ? 

The pigpen was built by the barn. 

The pigpen was built by the farmer. 


. 下 面 两 个 句子 的 语法 分 析 的 结果 有 什么 不 


同 ? 语义 分 析 的 结果 有 什么 不 同 ? 
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An awesome sunset Was seen by Andrea. 
Andrea Saw an awesome sunset. 


- 下 面 两 个 句子 的 语法 分 析 的 结果 有 什么 不 


同 ? 语义 分 析 的 结果 有 什么 不 同 ? 


IfX<10 then subtract 1 from X else add 1 from X. 
If X>10 then add 1 to X else subtract 1 from X. 


. 正文 中 , 与 形式 程序 设计 语言 相 比 , 简要 讨论 


了 理解 自然 语言 的 问题 , 作为 讨论 自然 语言 所 
涉及 的 复杂 性 方面 的 例子 , 给 出 问题 “Do you 
know what time it is?” 有 不 同 含义 的 情形 。 


. 一 个 句子 上 下 文 的 改变 能 够 改变 这 个 句子 的 


含义 以 及 意思 。 在 图 11-3 的 上 下 文中 ， 如 果 两 
人 都 出 生 于 21 世 纪 晚 期 ， 那 么 句子 “Mary hit 
John.” 的 含义 会 怎样 改变 ? 如 果 一 个 出 生 在 
20 世 纪 80 年 代 ， 而 另 一 个 出 生 在 21 世 纪 晚 期 ， 
那么 含义 又 会 如 何 改变 ? 


. 画 一 个 语义 网 ， 把 下 列 段落 的 意思 表示 出 来 。 


Donna threw the ball to Jack，who hit it into 
center field. The center fielder tried to catch it, 
but it bounced offthe wall instead. 


. 有 时 候 回答 一 个 问题 的 能 力 依赖 于 知识 水 平 ， 


这 与 对 事实 本 身 的 依赖 程度 相同 。 例 如 ,假定 
数据 库 A 和 B 都 包含 一 个 完整 的 雇员 名 单 ， 该 
名 单 与 公司 健康 保险 程序 相关 联 。 但 是 只 有 数 
据 库 A 知 道 名 单 是 完整 的 。 那 么 关于 一 个 不 在 
名 单 里 的 员工 ， 数 据 库 A 能 够 推断 出 的 什么 信 
息 是 数据 库 B 推 断 不 出 来 的 ? 

举 出 一 个 封闭 世界 假设 导致 矛盾 的 例子 。 

举 出 两 个 共用 一 个 封闭 世界 假设 的 例子 。 


. 在 产生 式 系统 中 ， 状 态 图 和 搜索 树 有 什么 


区 别 ? 
依照 一 个 产生 式 系统 分 析 解 决 魔方 问题 的 任 
务 。( 状 态 是 什么 ? 产生 式 是 什么 ? ) 


. a. 假定 搜索 树 是 一 个 二 叉 树 ,达到 目标 需要 8 


个 产生 式 。 如 果 该 树 是 以 广度 优先 的 方式 
构建 的 ， 那 么 当 达到 目标 状态 时 ， 树 中 最 
多 的 节点 数 是 多 少 ? 

b. 解释 通过 同时 构建 两 个 搜索 如 何 能 够 减少 
搜索 过 程 中 考虑 的 全 部 节点 数目 一 一 一 个 
搜索 从 初始 状态 开始 ， 同 时 另 一 个 搜索 从 
目标 状态 逆向 进行 , 直到 这 两 个 搜索 会 合 。 
(假设 记录 在 逆向 搜索 过 程 中 发 现 的 状态 
的 搜索 树 也 是 一 个 二 叉 树 ， 并 且 两 个 搜索 
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以 相同 速度 进行 搜索 ， 


24. 正文 中 我 们 提 到 , 产生 式 系统 通常 被 用 来 作为 


从 已 知事 实 中 得 出 结论 的 一 种 技术 .系统 的 状 
态 是 推理 过 程 的 每 一 个 阶段 认为 是 真 的 事实 ， 
产生 式 对 于 操纵 已 知事 实 来 说 是 逻辑 规则 。 标 
识 几 个 逻辑 规则 ， 支 持 从 事实 “John is a 
basketball player”、 “Basketball players are not 
short' 愉 及 “John is either short or tall” 中 能 够 
得 出 结论 “John is tall 

. 下 面 的 树 表 示 一 个 竞赛 游戏 中 可 能 的 移动 , 选 
手 X 当 前 可 在 移动 A 和 移动 B 中 选择 其 一 。 选 
手 X 移 动 后 ， 选 手 Y 跟 着 选择 移动 ， 然 后 由 选 
手 X 来 移动 最 后 一 步 。 树 的 叶子 节点 标记 为 
W、L 或 T， 分 别 代表 选手 X 最 后 是 赢 、 输 还 是 
平局 。 选 手 X 应 选择 移动 A 还 是 移动 B? 为 什 
么 ? 在 一 个 竞赛 性 的 氛围 中 选取 一 个 “产生 
式 ” 和 八 数码 游戏 等 单 人 游戏 中 的 选取 有 什么 
不 同 ? 
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. 按照 产生 式 系统 分 析 跳 棋 游戏 , 并 描述 一 个 用 
来 在 两 个 状态 中 确定 一 个 更 接近 目标 的 状态 
的 启发 。 这 种 情况 中 的 控制 系统 与 一 个 八 数码 
游戏 等 单 人 游戏 中 的 控制 系统 有 什么 区 别 ? 

. 把 代数 定律 看 作 产 生 式 , 代数 表达 式 简 化 的 问 
题 就 能 在 产生 式 系统 的 上 下 文中 解决 。 确 定 一 
组 代数 产生 式 ， 使 等 式 3/(2x-1)=6/(3x+1) 简 化 
为 x=3。 当 进行 这 种 代数 简化 时 , 一 般 规则 ( 即 
启发 法 则 ) 是 什么 ? 

. 不 用 任何 启发 信息 的 帮助 , 画 出 利用 广度 优先 
搜索 方法 解决 如 下 初始 状态 的 八 数 码 游戏 生 
成 的 搜索 树 。 


. 利用 图 11-10 的 最 佳 算法 解决 第 28 题 的 八 数码 
游戏 ,用 未 到 达 正 确 位 置 的 方块 的 数目 作为 启 
发 信息 ， 画 出 搜索 树 。 
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利用 图 11-10 的 最 佳 算法 解决 如 下 初始 状态 的 
八 数码 游戏 ， 假 设 使 用 与 11.3 节 中 一 样 的 启发 
信息 ， 画 出 搜索 树 。 


当 解决 八 数码 游戏 时 ， 为 什么 用 未 到 达 正 确 位 
置 的 方块 的 数目 作为 启发 信息 不 如 11.3 节 用 的 
那 种 好 ? 

执行 二 叉 树 搜索 〈 见 5.5$ 节 ) 时 决定 考虑 哪 一 
半 列 表 的 技术 , 和 执行 一 个 启发 搜索 时 决定 要 
执行 哪个 分 支 的 技术 ， 二 者 有 什么 不 同 ? 
注意 , 如 果 一 个 产生 式 系统 的 状态 图 中 有 一 个 
状态 的 启发 值 与 其 他 状态 相 比 极其 低 , 并 且 如 
果 从 这 个 状态 到 自身 有 一 个 产生 式 ， 那 么 图 
11-10 的 算法 会 陷入 一 个 循环 ,一遍 又 一 遍地 
考虑 这 个 状态 。 说 明 如 果 执 行 该 系统 中 任何 产 
生 式 的 代价 至 少 为 1， 那 么 把 启发 值 加 上 沿 遍 
历 的 路 径 到 达 该 状态 的 代价 , 通过 这 样 计算 规 
划 代 价 ， 就 可 以 避免 这 种 无 限 循环 。 

在 一 幅 大 的 道路 图 上 寻找 两 个 城市 间 的 道路 ， 
你 会 用 怎样 的 启发 ? 


. 请 看 在 寻找 从 Trent 到 Wildwood 的 路 线 时 ， 根 


据 图 11-10 中 的 最 佳 适应 算法 得 出 的 四 层 搜索 
树 。 这 一 搜索 树 中 的 每 个 节点 表示 地 图 上 的 一 
个 城市 。 开 始 节点 为 Trent。 当 扩展 一 个 节点 
时 ， 仅 添加 与 被 扩展 的 城市 直接 相连 的 城市 。 
在 每 个 节点 中 记录 到 Wildwood 的 直线 距离 并 
将 其 用 作 启 发 值 。 在 其 处 理 过 程 中 ， 最 佳 适 
应 算法 有 什么 不 足 之 处 吗 ? 如 果 有 , 应 该 怎样 
纠正 ? 


此 处 距 Wildwood 的 


直线 距离 ; 

Avon 10 
Bath 8 
Trent 15 
Seaport 13 


A* 算 法 从 两 个 主要 方面 修改 了 最 佳 适应 算 
法 。 首 先 ，A* 算 法 记录 到 每 个 状态 的 实际 成 
本 。 对 于 地 图 上 的 路 线 , 实际 的 成 本 便 是 行进 
的 距离 。 其 次 ， 当 选择 一 个 要 扩展 的 节点 时 ， 
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A* 算 法 选择 其 实际 成 本 与 启发 值 之 和 最 小 的 
节点 。 根据 这 两 个 修改 , 请 绘制 问题 35 的 搜索 
树 。 在 每 一 个 节点 中 记录 行进 至 这 一 节点 的 距 
离 、 到 达 目 标 城市 的 启发 值 ， 以 及 它们 的 和 。 
从 Dearborn 到 Wildwood 的 路 线 是 什么 呢 ? 
列 出 可 用 于 产生 式 系统 的 启发 所 具有 的 两 个 
假定 有 两 个 桶 , 一 个 容量 是 3 升 , 一 个 容量 是 5 
升 ,任何 时 候 你 都 可 以 把 水 从 一 个 桶 倒 入 男 一 
个 桶 ， 把 一 个 桶 倒 空 , 或 把 一 个 桶 倒 满 。 问 题 
是 要 将 正好 4 升 的 水 注入 5 升 的 那个 桶 ,说 明 这 
个 问题 如 何 可 以 设计 成 一 个 产生 式 系 统 。 
假设 你 的 任务 是 监督 两 辆 卡车 装 货 , 每 辆 车 最 
多 可 载 14 吨 货 。 货 物 装 在 不 同 的 板 条 箱 里 ， 总 
重 28 吨 ， 但 各 个 箱子 的 重量 不 一 样 。 每 个 箱子 
的 箱 边 上 都 标示 着 箱子 的 重量 .为 了 在 两 辆 车 
上 分 装 这 些 货物 , 你 会 采用 什么 样 的 启发 式 ? 
下 列 哪些 是 元 推理 的 例子 ? 
a. 他 已 经 走 了 很 长 时 间 了 , 一 定 已 经 走 远 了 。 
b. 因为 我 经 常 做 出 错误 的 决定 ， 而 所 做 的 最 
后 两 个 决定 是 正确 的 ， 所 以 我 将 逆转 我 的 
下 一 个 决定 。 
. 我 有 些 疲倦 了 ， 所 以 我 可 能 不 会 清晰 地 
思考 。 
我 有 些 疲倦 了 ， 所 以 我 想 我 将 要 打 个 睫 。 
描述 人 类 解决 框架 问题 的 能 力 如 何 帮助 人 类 
找到 丢失 的 物品 。 
a. 模仿 学 习 与 监督 训练 在 何 种 意义 上 相似 ? 
b. 模仿 学 习 与 监督 训练 在 何 种 意义 上 不 同 ? 
下 图 表示 一 个 用 于 11.5 节 讨论 的 联想 记忆 的 
人 工 神经 网 络 。 如 果 模 式 中 只 有 两 个 神经 元 
处 于 兴奋 状态 ， 而 这 两 个 神经 元 被 一 个 神经 
元 分 开 ， 那 么 它 与 什么 模式 相关 联 ?如 果 网 
络 初始 时 所 有 单元 都 处 于 抑制 状态 ， 会 发 生 
什么 情况 ? 
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下 图 表示 的 是 一 个 用 于 11.5 节 讨论 的 联想 记忆 
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复习 题 375 
的 人 工 神 经 网 络 。 如 果 初 始 模式 中 至 少 有 3 个 
神经 元 兴奋 ， 而 中 央 神 经 元 处 于 抑制 状态 ， 那 
么 它 与 怎样 的 稳定 布局 相关 联 ? 如 果 初 始 模式 
中 只 有 两 个 相对 的 周边 神经 元 兴奋 ， 那 么 将 会 
发 生 什 么 情况 ? 





设计 一 个 用 于 联想 记忆 (11.5 节 所 讨论 的 ) 的 
人 工 神经 网 络 ， 它 由 一 个 神经 元 矩形 队列 组 
成 , 要 移动 到 这 样 的 稳定 模式 : 其 中 一 个 纵 列 
的 神经 都 处 于 兴奋 状态 。 

调整 图 11-18 所 示 的 人 工 神经 网 络 中 的 权 值 和 
效 值 ， 使 其 在 两 个 输入 相同 〈 全 为 0 或 全 为 1) 
时 输出 为 1, 两 个 输入 不 同 (一 个 为 0 男 一 个 为 
1) 时 输出 0。 

夯 一 个 与 图 11-5 类 似 的 图 , 表示 把 代数 表达 式 
7x+3=3x-5 简 化 为 x=-2 的 过 程 。 
扩展 你 上 题 的 答案 , 说 明 解 题 时 控制 系统 可 道 
循 的 其 他 路 径 。 

画 一 个 与 图 11-5 类 似 的 图 ， 表 示 从 初始 事实 
“Polly is aparrot”“Aparrot is abird ”以 及 “All 
birds can fly” 中 得 到 结论 “Polly can fy” 的 


. 与 上 题 中 的 句子 不 同 ， 有 些 鸟 不 会 飞 ， 如 能 鸟 


或 是 折 了 翅膀 的 鸟 。 但 是 ， 要 建立 一 个 演绎 推 
理 系统 ， 其 中 把 对 陈述 “All birds can fly” 的 所 
有 例外 都 明确 列 出， 看 来 并 不 合理 。 那 么 ， 我 
们 人 类 如 何 确定 一 只 乌 是 能 飞 还 是 不 能 飞 呢 ? 

详 述 句子 “I read the new tax law” 在 不 同上 下 
文中 的 不 同 含义 。 

说 明 怎 样 能 够 把 从 一 个 城市 旅行 到 另 一 个 城 
市 的 问题 设计 成 一 个 产生 式 系 统 。 状 态 是 什 
么 ? 产生 式 是 什么 ? 

假定 你 要 执行 3 个 任务 A、B 和 C， 它 们 可 以 以 
任意 次 序 执行 (但 不 能 同时 )。 说 明 这 个 问题 如 
何 设计 成 一 个 产生 式 系统 ， 并 画 出 其 状态 图 。 

对 于 上 一 题 中 的 状态 图 ， 如果 任务 C 一 定 要 在 
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任务 B 之 前 执行 ， 那么 怎样 改变 状态 图 ? 开发 一 个 排序 长 度 为 10 的 列表 的 程序 。 
55. a, 如 果 (i, 7) 用 来 表示 “车 一 个 列表 中 第 i 个 位 56. 假定 一 组 机 器 人 的 每 个 成 员 都 配备 有 一 对 传 
置 的 项 大 于 第 /个 位 置 的 项 ， 则 把 两 项 交 感 器 ， 每 个 传感器 都 能 探测 到 正 前 方 2 米 范围 
换 ” 其 中 i 为 正 整数 ， 那 么 下 面 两 个 序 内 的 物体 。 每 个 机 器 人 的 形状 都 像 一 个 圆 的 垃 
列 中 哪 一 个 能 更 好 地 完成 一 个 长 度 为 3 的 圾 简 , 能 在 任何 方向 移动 。 试 设计 一 系列 实验 ， 
列表 的 排序 ? 用 来 确定 传感器 应 该 装 在 哪里 , 使 得 制造 出 的 
(1 3)(3, 2) 机 器 人 能 成 功 地 将 一 个 篮球 直线 抛 出 ,你 的 一 
(1, 2)(2, 3)(1, 2) 系列 实验 如 何 与 一 个 进化 系统 相 比 较 ? 
b. 注意 , 通过 这 种 方式 表示 交换 序列 ， 序列 能 57. 你 做 决定 时 是 倾向 基于 反应 模式 还 是 倾向 基 
够 加 入 子 序列 ， 然 后 重新 结合 形成 新 的 序 于 计划 模式 ? 你 的 回答 是 否 依 赖 于 问题 是 关 
列 。 使 用 该 方法 ， 描 述 一 种 遗传 算法 ， 用 于 于 决定 中 午 吃 什么 还 是 作出 职业 决策 ? 
社会 问题 





希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 道德 、 社 会 和 法 律 问题 。 回 答 出 这 
些 问题 还 不 够 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 


l: 


核能 、 遗 传 工程 以 及 人 工 智 能 领域 的 研究 者 应 该 对 他 们 研究 成 果 的 利用 方式 承担 多 
大 责任 ? 科学 家 对 其 研究 揭示 的 知识 是 否 负 有 责任 ? 若 因此 产生 了 意 想 不 到 的 后 
果 ， 怎 么 办 ? 


. 怎样 区 分 智能 和 模拟 的 智能 ? 你 认为 二 者 有 区 别 吗 ? 
.假定 一 个 计算 机 化 的 医疗 专家 系统 因 其 给 出 合理 的 建议 而 在 医疗 界 享有 盛誉。 作为 一 个 


医生 ， 应 该 在 多 大 程度 上 让 这 个 系统 代替 他 为 病人 作出 治疗 决定 。 如 果 医 生 的 治疗 方案 
与 专家 系统 提出 的 治疗 方案 相对 立 ， 并 且 后 来 证 实 专家 系统 是 正确 的 ， 那 么 那个 医生 是 
和 否 应 该 对 其 不 当 治疗 负 有 责任 ? 一 般 说 来 ,如 果 一 个 专家 系统 在 某 个 领域 内 很 有 名 ， 那 
么 在 多 大 程度 上 它 会 束缚 而 不 是 提高 人 类 专家 的 判断 力 ? 


. 许多 人 认为 计算 机 的 行为 只 不 过 是 人 类 对 它 进行 编程 的 结果 ， 所 以 计算 机 不 可 能 有 自主 


志 。 从 而 ,计算机 也 不 应 对 它 的 行为 负责 。 人 脑 是 计算 机 吗 ? 人 是 否 在 出 生 的 时 候 就 
事先 被 编程 好 了 ? 人 是 否 会 被 他 所 处 的 环境 编程 ? 人 是 否 要 对 自己 的 行为 负责 ? 


. 是 否 有 这 样 一 些 手段 ， 科 学 即使 能 够 去 做 ， 也 不 应 当 去 做 ? 例如 ， 如 果 有 朝 一 日 可 以 造 


出 感知 和 推理 技巧 能 与 人 类 匹敌 的 机 器 ,那么 建造 这 样 的 机 器 是 否 恰当 ? 这 种 机 器 的 出 
现 会 带 来 什么 样 的 问题 ? 今天 其 他 一 些 科 学 领域 的 进展 正在 引发 哪些 问题 ? 


. 历史 上 有 许多 例子 表明 ， 科 学 家 、 艺 术 家 的 创作 活动 会 受 其 所 处 时 代 的 政治 、 宗 教 及 其 


他 社会 因素 的 影响 。 这 样 的 一 些 因 素 以 何 种 方式 影响 着 当今 的 科学 成 就 ?特别 在 计算 机 
科学 领域 情况 如 何 ? 


. 当今 ， 技 术 的 进步 导致 一 些 人 的 工作 变 得 多 余 ， 许 多 文化 至 少 应 担负 起 一 定 的 责任 来 帮 


助 对 这 些 人 进行 再 教育 。 随 着 技术 使 我 们 越 来 越 多 的 能 力 变 得 多 余 ， 社 会 应 当 或 能 够 做 
些 什 么 ? 


. 假定 你 收 到 一 张 计 算 机 处 理 的 费用 为 $80.00 的 账单 ， 你 该 怎么 办 ? 假定 你 置之不理 ，30 


天 后 你 又 收 到 第 二 张 $0.00 的 催 款 通知 单 ， 你 该 怎么 办 ? 假定 你 依然 不 理 皮 ,而 30 天 后 你 
又 收 到 了 一 张 $0.00 的 催 款 通知 单 ， 而 且 还 有 提示 ， 若 不 及 时 付款 ， 将 诉 诸 法律 。 谁 将 对 


此 负责 ? 


. 是 否 有 这 样 的 时 候 , 你 会 把 个 性 与 个 人 电脑 联系 在 一 起 ? 计算 机 好 像 在 施行 报复 或 者 固执 
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难 缠 ? 计算 机 是 否 曾 令 你 抓 狂 ? 对 计算 机 恼火 和 对 计算 机 所 做 的 结果 恼火 有 什么 不 同 ? 
计算 机 和 你 生 过 气 吗 ? 你 与 别 的 东西 ， 如 汽车 、 电 视 机 、 圆 珠 笔 ， 有 过 类 似 的 关系 吗 ? 
10. 根据 你 对 问题 9 的 回答 ， 人 在 多 大 程度 上 会 把 一 个 实体 的 行为 与 智能 和 意识 的 存在 联系 
起 来 ? 人 应 当 在 多 大 程度 上 做 这 样 的 关联 ? 对 于 一 个 智能 实体 来 说 ， 是 否 可 能 用 有 别 

于 其 他 行为 的 方式 来 展现 它 的 智能 ? 

11. 许多 人 觉得 ， 能 通过 图 灵 测试 并 不 意味 着 机 器 有 智能 。 一 个 论点 是 ， 智 能 的 行为 本 身 并 
不 意味 智能 。 而 进化 论 的 基础 是 适 者 生存 ， 这 就 是 一 种 基于 行为 的 测试 。 是 否 进化 论 意 
味 着 智能 行为 是 智能 的 前 身 ? 机 器 能 通过 图 灵 测 试 ， 是 否 意 味 着 它们 正 变 得 有 智能 ? 

12. 医疗 手段 已 经 取得 了 很 大 的 进步 ， 人 体 的 许多 器 官 现在 都 能 用 人 造 器 官 或 者 捐赠 人 的 
器 官 来 蔡 代 。 可 以 设想 ， 终 究 有 一 天 连 大 脑 也 能 换 。 如 果 这 变 成 现实 ， 会 产生 什么 样 
的 道德 问题 ? 如果 一 个 病人 的 神经 细胞 被 人 造 神经 细胞 一 点 点 换 掉 ， 那 个 病人 还 是 同 
一 个 人 吗 ? 那个 病人 会 觉察 到 有 什么 不 同 吗 ? 那个 病人 还 算 人 吗 ? 

13. 一 台 汽 车 中 的 GPS 能 够 提供 友好 的 语音 提示 ， 通 知 驾驶 员 即 将 到 来 的 转弯 及 其 他 操作 。 
当 驾 驶 员 犯 错时 ，GPS 会 自动 进行 调整 ， 并 在 不 带 任 何不 当 情 绪 的 情况 下 指导 驾驶 员 
返回 正确 路 线 。 你 是 否认 为 当 驾驶 员 要 罗 车 去 一 个 未 知 目的 地 时 ，GPS 可 以 减 小 驾驶 
员 的 压力 ? GPS 又 会 从 哪些 方面 给 驾驶 员 带 来 压力 呢 ? 

14. 假设 你 的 智能 手机 提供 了 语音 到 语音 的 语言 翻译 ， 你 使 用 这 个 功能 会 觉得 舒服 吗 ? 你 
相信 它 能 传达 准确 的 语义 吗 ? 你 会 有 顾虑 吗 ? 
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计算 理论 


章 将 讨论 计算 机 科学 的 理论 基础 。 从 某 种 意义 上 说 ， 正 是 本 章 所 讨论 的 内 容 为 计算 

机 科学 莫 定 了 其 真正 的 学 科 地 位 。 尽 管 本 质 上 有 些 抽象 ， 但 该 知识 体系 已 经 有 许多 
非常 实际 的 应 用 。 具 体 来 说 ， 我 们 将 讨论 有 关 编 程 语言 能 力 的 内 在 问题 ， 以 及 如 何 通 过 它 来 构 
建 广泛 用 于 因特网 通信 的 公 钥 加 密 系统 。 


本 章 内容 

12.1 函数 及 其 计算 12.4 一 个 不 可 计算 的 函数 
12.2 图 灵机 12.5 问题 的 复杂 性 

12.3 通用 程序 设计 语言 *12.6” 公 钥 密 码 学 


本 章 要 讨论 的 是 有 关 计 算 机 能 做 什么 以 及 不 能 做 什么 的 问题 。 我 们 将 看 到 ， 一 种 称 为 图 灵 
机 的 简单 机 器 如 何 被 用 来 确定 机 器 可 解 问题 与 机 器 不 可 解 问题 之 间 的 界线 。 我 们 还 将 确定 一 个 
特定 的 问题 ， 就 是 停机 问题 ， 这 个 问题 的 解决 超出 了 算法 系统 的 能 力 ， 所 以 也 就 超出 了 当今 性 
至 未 来 计算 机 的 能 力 。 而 且 ， 我 们 会 发 现 ， 即 使 在 机 器 可 解 的 问题 中 ， 仍 然 存在 一 些 复 杂 的 问 
题 ， 从 任何 实际 的 角度 来 看 还 是 不 可 解 的 。 最 后 要 讨论 的 是 ， 复 杂 性 领域 内 的 知识 如 何 被 用 来 
构建 公 钥 加 密 系 统 。 


12.1 函数 及 其 计算 


本 章 的 目的 在 于 研究 计算 机 的 能 力 。 我 们 要 理解 机 器 能 做 什么 和 不 能 做 什么 ， 以 及 机 器 要 
实现 其 全 部 潜能 需 具 备 要 哪些 特征 。 我 们 在 前 面 的 章节 里 讲 过 一 些 Python 函数 的 例子 ,但 这 里 ， 
我 们 从 更 一 般 的 计算 数学 函数 的 概念 开始 进行 讨论 。 

从 数学 意义 上 讲 ， 函 数 〈function) 是 一 组 可 能 的 输入 值 和 一 组 可 能 的 输出 值 之 间 的 对 应 关 
系 ， 它 使 每 个 可 能 的 输入 被 赋予 单一 的 输出 。 例 如， 将 度量 从 码 转化 为 米 的 函数 。 如 果 是 同样 
的 距离 ， 每 次 用 码 作 为 单位 度量 与 用 米 作为 单位 度量 的 结果 之 间 存 在 着 对 应 关系 。 再 如 排序 函 
数 ， 该 函数 对 每 个 输入 的 数值 表 都 赋予 了 一 个 输出 表 ， 而 输出 表 的 数据 项 与 输入 表 一 样 ， 只 是 
输出 表 的 数据 项 是 按照 升序 排列 的 。 还 有 一 个 例子 就 是 加 法 函数 ， 该 函数 的 输入 是 一 对 数值 ， 
输出 是 该 对 输入 值 的 和 。 

对 于 一 个 给 定 的 输入 ， 确 定 其 具体 的 输出 值 的 过 程 称 为 函数 的 计算 。 对 函数 进行 计算 的 能 
力 非常 重要 ， 因 为 正 是 通过 对 函数 进行 计算 ， 问 题 才 能 得 到 解决 。 为 了 解决 一 个 加 法 问题 ， 就 
必须 计算 加 法 函数 ; 为 了 对 列表 进行 排序 ， 则 必须 计算 排序 函数 。 因 此 ， 计 算 机 科学 的 一 个 基 
本 问题 就 是 要 找到 能 求解 问题 背后 的 函数 的 技术 。 
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A 
出 了 算法 的 能 力 。 


例如 ， 考 虑 下 面 这 样 一 个 系统 ， 其 中 ， 函 数 的 输入 和 输出 能 预先 确定 ， 并 记录 在 一 个 表 中 。 
每 当 需 要 函数 的 输出 时 ， 我 们 只 需 查找 表 中 的 给 定 输入 ， 就 能 找到 所 需 的 输出 。 这 样 一 来 ， 这 
个 函数 的 计算 就 简化 为 表 的 搜索 过 程 。 这 样 的 系统 比较 方便 ， 但 
功能 有 限 ， 因 为 许多 函数 不 可 能 完全 表示 成 表格 形式 。 如 图 12-1 
所 示 的 例子 ， 例 中 展示 的 函数 要 将 以 码 为 单位 的 量 值 转化 为 以 米 
为 单位 的 量 值 。 因 为 可 能 的 输入 /输出 对 是 无 限 的 , 所 以 这 个 表 注 
定 是 不 完整 的 。 

计算 函数 的 一 个 比较 有 效 的 方法 是 遵循 代数 式 所 提供 的 方 
向 ， 而 不 是 试图 将 所 有 可 能 的 输入 /输出 组 合 都 显示 在 表格 中 。 例 
如 ， 可 以 用 代数 公式 








V=P(+r) 
来 表示 怎样 计算 一 个 为 P 的 投资 额 ( 年 复 利率 为 r) 在 n 年 后 的 ”图 12-1 显示 将 码 量度 转化 为 
金额。 米 量度 的 函数 的 尝试 

但 是 ， 代 数 公式 的 表达 能 力也 有 它 的 局 限 性 。 有 些 函数 ， 它 的 输入 /输出 关系 太 过 复杂 ， 以 
致 不 能 用 代数 运算 来 描述 。 这 样 的 例子 包括 三 角 函 数 ， 如 正弦 函数 和 余弦 函数 。 如 果 要 你 计算 38 
”的 正弦 值 ， 你 可 能 会 画 出 相应 的 三 角形 ， 测 出 它 的 边 长 ， 然 后 计算 所 求 的 比率 ， 而 这 样 的 一 
个 过 程 就 不 能 表示 为 对 数值 38 的 代数 运算 。 用 袖珍 计算 器 来 计算 38"” 的 正弦 值 也 是 比较 费劲 的 。 
实际 上 ， 对 38" 的 正弦 值 而 言 ， 必 须 利 用 较 复杂 的 数学 方法 来 得 到 一 个 非常 接近 的 近似 值 ， 并 
将 此 作为 答案 。 

于 是 可 以 看 出 ， 当 考虑 的 函数 越 来 越 复杂 时 ,我 们 不 得 不 应 用 更 为 强大 的 技术 来 计算 它们 。 
我 们 的 问题 是 ， 不 管 函 数 的 复杂 性 如 何 ， 我 们 是 否 总 能 找到 一 个 系统 来 计算 它们 。 答 案 是 和 否定 
的 。 有 一 个 结论 令 人 难受 ， 那 就 是 存在 这 样 的 一 些 函 数 ， 它 们 过 于 复杂 以 致 找 不 到 定义 明确 的 、 
一 步 一 步 的 过 程 来 根据 输入 值 确定 它们 的 输出 值 。 结 果 ， 这 些 函 数 的 计算 就 超出 了 任何 算法 系 
统 的 能 力 范围 ， 这 样 的 函数 就 称 为 不 可 计算 的 。 而 有 些 函 数 ， 如 果 可 以 依据 它们 的 输入 值 ， 通 
过 算法 来 确定 其 输出 值 ， 就 称 其 为 可 计算 的 〈computable )。 

在 计算 机 科学 中 ， 可 计算 函数 与 不 可 计算 函数 之 间 的 区 别 很 重要 。 这 是 因为 ， 机 器 只 能 
执行 由 算法 描述 的 任务 , 所 以 可 计算 函数 的 研究 最 终 是 对 机 器 能 力 的 研究 。 如 果 我 们 能 够 确 
定 这 样 的 能 力 ， 即 允许 机 器 计算 所 有 可 计算 函数 的 能 力 ， 并 造 出 具有 这 些 能 力 的 机 器 ， 那 么 
就 可 以 确信 ， 所 建造 的 机 器 就 如 我 们 所 设想 的 一 于 有 如 果 发 现 一 个 问题 的 解决 方 
案 需 要 计算 一 个 不 可 计算 函数 , 那么 可 以 得 出 这 样 的 结论 : 该 问题 的 求解 超出 了 机 器 的 能 力 
范围 。 
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问题 与 练习 

未 给 出 一 些 能 完全 由 表格 形式 表示 的 函数 。 

i 要 求 其 输出 可 以 描述 为 包括 其 输入 的 一 个 代数 式 。 

3, 给 一 个 不 能 用 代数 公式 来 描述 的 函数 。 你 的 这 个 函数 是 否 仍然 为 可 计算 的 ? 

希腊 数学 家 用 直 尺 和 圆规 画图 形 。 他 们 借 此 探索 出 一 些 技术 ,用 来 找 一 条 直线 的 中 点 ， 构建 一 个 直 
a 人 及 画 一 个 等 边 三 角形 。 然 而 ， 他 们 的 “计算 系统 ”不 能 完成 的 “计算 ”是 什么 ? 






一 = 一 一 一 一 一- 一 一 一 一 一 一 一 一 = 一 一 ~ 一 一 = 一 .一 -一 -一 -一 一 = 一 一 一 -一 -一 一 .一 -一 一 一 一 一 


12.2 ”图 灵机 


在 理解 机 器 的 能 力 及 其 局 限 性 的 工作 中 ， 许 多 研究 人 员 已 经 提出 并 研究 了 各 种 不 同 的 计算 
设备 。 其 中 之 一 就 是 图 灵机 ， 它 是 由 阿兰 。 图 灵 于 1936 年 提出 来 的 ， 今 天 ， 它 仍然 被 用 作 研 究 
算法 处 理 能 力 的 一 种 工具 。 


12.2.1 图 灵机 的 原理 


图 灵机 (Turing machine) 是 由 一 个 控制 单元 组 成 的 ， 它 能 够 通过 一 个 读 / 写 磁 头 对 磁带 上 的 
符号 进行 读 和 写 〈 见 图 12-2)。 磁 带 两 端 可 以 无 限 延 伸 ， 并 分 成 一 个 个 单元 ， 而 每 个 单元 可 以 包 
含 符号 的 任意 一 个 有 限 集合 ， 这 个 集合 称 为 机 器 的 字母 表 。 








A “计算 过 程 ” 的 局 限 性 。 在 此 前 不 久 ，1931 年 ， 哥 德尔 (G6del) 发 
表 了 著名 的 揭示 计算 系统 局 限 性 的 论文， 并 且 其 研究 的 主要 精力 集中 在 理解 这 些 局 限 性 上 . 






| 出 他 的 模型 的 同一 年 (1936 年 )， 埃 米尔 。 波 斯 特 (Emil Post) 提出 了 另外 一 种 模 
: 其 称 为 波斯 特产 生 式 系统 )， 他 所 提出 的 这 个 模型 与 图 灵 的 模型 有 着 同样 的 能 力 。 
作为 这 些 早期 研究 人 员 洞察 力 的 见证 ， 他 们 的 计算 系统 模型 (如 图 灵机 和 波斯 特产 生 式 系统 
等 ) 在 计算 机 科学 研究 领域 ， 仍 然 可 以 作为 有 价值 的 工具 来 使 用 。 


在 图 灵机 计算 的 任何 一 时 刻 ， 机 器 一 定 处 在 有 限 个 条 件 中 的 一 个 ， 这 些 条 件 称 为 状态 。 图 
灵机 的 计算 开始 于 一 个 特定 的 状态 ， 称 为 初始 状态 ， 而 停止 于 另 一 特定 的 状态 ， 称 为 停止 状态 。 
图 灵机 的 计算 由 机 器 的 控制 单元 执行 的 一 系列 步骤 组 成 。 每 一 步 都 包括 观察 当前 磁带 单元 
中 的 符号 〈 由 读 / 写 磁头 所 看 到 的 那个 )， 然 后 将 符号 写 进 这 个 单元 ， 期 间 可 能 要 将 读 / 写 磁头 左 
移 或 右 移 一 个 单元 ， 接 下 来 再 改变 状态 。 要 执行 的 确切 操作 是 由 程序 决定 的 ， 程 序 通过 机 器 的 
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状态 和 磁带 当前 单元 的 内 容 来 告诉 控制 单元 做 什么 。 
现在 来 考虑 图 灵机 的 一 个 具体 的 例子 。 为 此 ， 我 们 将 机 器 的 磁带 表示 成 一 条 水 平 条 带 ， 并 
将 条 带 分 成 一 个 个 单元 ， 且 单元 中 可 以 记录 机 器 字母 表 里 的 符号 。 可 以 通过 在 磁带 当前 单元 放置 
一 个 标签 来 标示 机 器 的 读 / 写 磁头 的 当前 位 置 。 本 例 中 的 
字母 包括 0、1 和 *。 机 器 的 磁带 的 样子 如 图 12-3 所 示 。 dt ee \ 
磁带 上 的 符号 串 可 以 解释 为 由 星 号 分 开 的 二 进 制 
数 ， 那 么 可 以 看 出 ， 这 个 磁带 包含 的 是 值 5。 我 们 所 设 当前 位 置 
计 的 图 灵机 要 把 磁带 上 的 这 样 一 个 值 加 1。 更 准确 地 说 ， 图 12-3” 机 器 的 磁带 的 样子 
假设 开始 位 置 是 标 在 一 串 0 和 1 右 端的 星 号 ， 接 下 来 要 做 
的 是 改变 其 左边 的 位 模式 ， 使 其 可 以 表示 下 一 个 较 大 的 整数 。 
我 们 机 器 的 状态 有 : STRART (开始 )、ADD( 相 加 )、CARRY (进位 )、OVEREFLOW (溢出 )、 
RETURN (返回 ) 以 及 HALT (停止 )。 这 些 状态 对 应 的 每 一 个 动作 和 当前 单元 的 内 容 如 图 12-4 中 
的 表 所 示 。 这 里 假设 机 器 一 直 是 从 STRAT 状 态 开始 的 。 





图 12-4 ”实现 增加 值 操作 的 图 灵机 


现在 把 这 个 机 器 应 用 到 图 12-3 所 示 的 包含 值 5 的 磁带 上 。 可 以 观察 到 , 当 处 在 START 状 态 时 ， 
当前 单元 包含 * 〈 在 本 例 中 )， 图 12-3 中 的 表格 指示 我 们 要 重 写 *， 并 将 读 / 写 磁头 左 移 一 个 单元 ， 
这 时 就 进入 了 ADD 状 态 。 做 完 这 些 后 ， 机 器 的 情况 就 如 图 12-5 所 示 。 

为 了 继续 ， 我 们 查 表 看 当 处 于 ADD 状 态 并 且 当 前 单元 包含 1 时 ， 机 器 要 做 些 什 么 。 图 12-3 所 
示 的 表 告 诉 我 们 要 用 0 代替 当前 单元 的 1， 并 把 读 / 写 磁头 左 移 一 个 单元 ， 这 时 就 进入 了 CARRY 状 
态 。 这 样 一 来 ， 机 器 的 情况 就 如 图 12-6 所 示 。 


区 当 式 到家 时 。 计 扩 /1 |:|\ 


机 器 状态 =ADD 当前 位 置 机 器 状态 =CARRY 二 


图 12-5 机 器 状态 为 ADD 时 对 应 的 情况 图 12-6 机 器 状态 为 CARRY 时 对 应 的 情况 


接 下 来 ， 我 们 再 去 查 表格 ， 看 看 当 机 器 处 在 CARRY 状 态 并 且 当 前 单元 包含 0 时 要 做 什么 。 表 
格 告诉 我 们 应 该 用 1 来 代替 0， 并 把 读 / 写 磁 头 右 移 一 个 单元 ， 这 时 就 进入 了 RETURN 状 态 。 做 完 
这 些 后 ， 机 器 的 情况 就 如 图 12-7 所 示 。 

根据 这 个 情况 ， 表 格 指示 我 们 用 另 一 个 0 来 代替 当前 单元 中 的 0， 并 把 读 / 写 磁 头 右 移 一 个 单 
元 ， 这 时 就 保持 在 RETURN 状 态 。 结 果 ， 机 器 的 情况 就 如 图 12-8 所 示 。 
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这 六 洲 浊 区 尖 。 用 
机 器 状态 =RETURN 当前 位 置 机 器 状态 =RETURN 当前 位 置 
图 12-7 机 器 状态 为 RETURN 时 对 应 的 情况 图 12-8 ”保持 RETURN 状 态 时 对 应 的 情况 


在 这 个 时 候 ， 我 们 可 以 看 到 ， 表 格 指 示 我 们 在 当前 单元 中 重 写 *， 同 时 进入 HALT 状 态 。 于 
是 ， 机 器 就 停止 在 如 图 12-9 所 示 的 情况 (磁带 上 的 符号 就 表示 了 所 需要 的 值 6)。 


J:|'1|':1|°。 WN\ 


机 器 状态 =HALT 当前 位 置 
图 12-9 机 器 状态 为 BALT 时 对 应 的 情况 


12.2.2” 丘 奇 - 图 灵 论 题 


前 面 例子 中 的 图 灵机 可 以 用 来 计算 所 谓 的 后 继 函 数 ,使 用 这 种 函数 , 每 个 非 负 整数 输入 值 n 
的 输出 值 为 +1。 我 们 只 需要 把 用 二 进 制 形式 表示 的 输入 值 放 在 机 器 的 磁带 上 , 运行 机 器 直至 
停止 ， 然 后 就 可 以 从 磁带 上 读 取 输出 值 。 由 图 灵机 以 这 种 方式 计算 的 函数 称 为 图 灵 可 计算 的 
(Turing computable) 函数 。 

图 灵 猜 想 是 指 : 图 灵 可 计算 函数 与 可 计算 函数 是 一 样 的 。 换 句 话 说， 图 灵 猜 想 ， 图 灵机 的 
计算 能 力 宫 括 了 任何 算法 系统 的 能 力 ， 或 者 同样 也 可 以 这 么 说 ，( 与 表格 和 代数 公式 这 些 方法 形 
成 对 比 ) 图 灵机 概念 提供 了 一 个 环境 ， 在 此 环境 下 ， 所 有 可 计算 函数 的 解 都 能 够 被 表示 。 在 今 
天 ， 这 个 猜想 通常 被 称 为 丘 奇 一 图 灵 论 题 (Church-Turing thesis)， 这 是 为 了 纪念 阿兰 。 图 灵 和 
阿 隆 佐 。 丘 奇 这 两 个 人 的 贡献 。 自 从 图 灵 的 最 初 工作 以 来 ， 已 经 收集 了 许多 支持 这 个 论题 的 例 
证 ， 现 在 ， 丘 奇 - 图 灵 论 题 已 经 被 广泛 接受 了 。 也 就 是 说 ， 可 计算 函数 与 图 灵 可 计算 函数 被 认为 
是 一 回 事 。 

这 个 猜想 的 意义 就 在 于 ， 它 领悟 到 了 计算 机 器 的 能 力 和 局 限 性 。 更 为 准确 地 说 ， 它 把 图 灵 
机 的 能 力 确立 为 一 种 标准 ， 因 而 其 他 计算 系统 就 能 够 与 此 进行 比较 。 如 果 一 个 计算 系统 能 够 计 
算 所 有 的 图 灵 可 计算 函数 ， 那 么 就 可 以 认为 它 的 能 力 与 任何 计算 系统 的 能 力 相 当 。 


问题 与 练习 
1. 应 用 本 节 所 描述 的 图 灵机 ( 见 图 12-4)， 从 如 下 的 初始 状态 开始 。 





机 器 状态 =START 当前 位 置 


2. 描述 一 个 图 灵机 ， 要 求 用 一 个 0 来 替换 一 串 0 和 1。 

3. 描述 一 个 图 灵机 ， 其 要 求 是 : 如 果 磁 带 上 的 值 大 于 0， 则 该 值 要 减 1;， 如 果 磁 带 上 的 值 为 0， 则 该 值 保持 
不 变 。 

4. 给 出 一 个 日 常生 活 的 场景 ， 要 求 该 场景 中 要 有 计算 的 活动 发 生 。 这 个 场景 怎样 与 图 灵机 进行 类 比 ? 

5. 描述 一 个 图 灵机 ， 要 求 它 在 输入 某 些 值 时 最 终 会 停止 ， 而 在 输入 其 他 值 时 永 不 会 停止 。 
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12.3， 通 用 程序 设计 语言 


在 第 6 章 中 ,我 们 讨论 了 高 级 程序 设计 语言 中 的 各 种 特性 。 本 节 中 ,我 们 要 应 用 可 计算 性 方 
面 的 知识 来 确定 这 些 特性 中 哪些 特性 是 真正 必需 的 。 我 们 会 发 现 ， 当 今 的 高 级 语言 中 的 许多 特 
性 仅仅 是 增强 使 用 的 方便 性 ， 而 对 语言 的 基本 功能 并 没有 什么 贡献 。 

我 们 的 方法 是 描述 一 种 简单 的 指令 性 程序 设计 语言 ， 而 这 种 丰富 的 语言 足以 用 来 表达 计算 所 有 
图 灵 可 计算 函数 (因此 也 包括 所 有 可 计算 函数 ) 的 程序 。 因 此 ， 如 果 以 后 的 程序 员 发 现 一 个 用 这 种 
语言 解决 不 了 的 问题 ， 那 么 其 原因 并 不 在 于 这 种 语言 的 缺陷 。 相 反 ， 问 题 出 在 没有 用 于 解决 这 个 问 
题 的 算法 。 具有 这 种 特性 的 程序 设计 语言 称 为 通用 程序 设计 语言 (universal programming language )。 

你 也 许 会 惊奇 地 发 现 ， 通 用 程序 设计 语言 其 实 并 不 需要 很 复杂 。 事 实 上 ， 我 们 将 要 介绍 的 
这 种 语言 会 非常 简单 。 因 为 它 是 从 通用 程序 设计 语言 中 分 离 出 来 的 需求 的 最 小 集合 ， 所 以 将 它 
称 为 Bare Bones (基本 要 素 ) 语言 。 








12.3.1 Bare Bones 语 言 


为 了 表述 Bare Bones 语 言 ， 这 里 就 先 来 考虑 其 他 程序 设计 语言 中 的 变量 。 尽 管 机 器 本 身 只 能 处 
理 二 进 制 位 模式 ， 并 且 不 知道 模式 所 表示 的 内 容 ， 但 是 程序 员 可 以 利用 这 些 声 明 语句 从 数据 结构 和 
数据 类 型 (如 数值 数组 和 字符 串 等 ) 方面 考虑 问题 。 用 来 处 理 精巧 的 数据 类 型 和 数据 结构 的 高 级 指 
令 在 提交 给 机 器 执行 之 前 ， 必 须 被 翻译 成 机 器 指令 ， 这 些 指令 操纵 位 模式 来 模拟 所 需 的 操作 。 

为 了 方便 ， 可 以 将 这 些 位 模式 解释 成 二 进 制 计数 法 表示 的 数值 。 这 样 一 来 ， 由 计算 机 完成 
的 所 有 计算 都 能 够 表达 成 包括 非 负 整 数 的 数值 计算 ， 这 是 有 目 共 睹 的 。 而 且 ， 如 果 要 求 程 序 员 
按 这 种 方式 表示 算法 ， 那 么 程序 设计 语言 就 能 得 到 简化 〈 尽 管 这 会 大 大 增加 程序 员 的 负担 )。 

由 于 我 们 开发 Bare Bones 语 言 的 目标 是 开发 出 最 简单 的 语言 ， 所 以 我 们 将 遵循 这 个 思路 。 
考虑 将 Bare Bones 语 言 中 的 所 有 变量 都 表示 成 位 模式 ， 为 了 方便 ， 我 们 将 其 解释 为 二 进 制 计数 
法 表示 的 非 负 整 数 。 这 样 一 来 , 一 个 当前 被 赋值 为 模式 10 的 变量 将 包含 值 2, 而 被 赋值 为 模式 101 
的 变量 将 包含 值 5。 

利用 这 种 约定 ，Bare Bones 程 序 中 的 所 有 变量 都 属于 同一 种 类 型 ， 这 样 一 来 ， 这 种 语言 就 
不 需要 用 于 转换 值 类 型 的 操作 ， 或 者 声明 语句 ， 来 描述 不 同 变量 的 名 字 和 与 之 相关 的 属性 了 。 
当 利用 Bare Bones 语 言 时 , 像 Python 一 样 , 程序 员 可 以 在 需要 时 只 使 用 一 个 新 变量 名 即 可 , 这 里 ， 
程序 员 理 解 的 是 ， 它 是 一 个 解释 成 非 负 整数 的 二 进 制 位 模式 。 

当然 ,用 在 Bare Bones 语 言 中 的 翻译 器 必须 能 够 把 变量 名 和 其 他 术语 区 分 开 来 。 要 做 到 这 一 点 ， 
需要 设计 出 Bare Bones 语 言 的 语法 ， 以 便 只 需 通 过 语法 就 可 以 识别 出 任何 术语 的 作用 。 为 了 达到 这 
个 目的 ， 我 们 规定 : 变量 名 必须 以 英文 字母 开始 ， 后 面 可 以 跟 字 母 和 数字 〈0 一 9) 的 任意 组 合 。 这 
样 一 来 ， 字 符 串 XYZ、B747、abcqdefghi 以 及 X5Y 都 能 用 作 变量 名 ， 而 2G5、%o 和 x.y 就 不 能 。 

现在 ， 让 我 们 来 考虑 Bare Bones 语 言 中 的 过 程 语句 。 这 里 有 三 个 赋值 语句 和 一 个 表示 循环 
的 控制 结构 语句 。 根 据 Python 风 格 的 语法 ， 我 们 采用 这 样 的 原则 : 每 行 上 只 写 一 条 语句 ， 并 且 使 
用 缩 进 标记 循环 结构 体 。 

三 条 赋值 语句 ， 每 条 都 要 求 改 变 语句 中 所 标识 的 变量 的 内 容 。 第 一 条 语句 可 以 让 一 个 变量 
清 零 ， 其 语法 为 

clear name 


其 中 name 可 以 是 任何 变量 名 。 
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另外 两 条 赋值 语句 的 作用 本 质 上 是 相反 的 : 


incr name 


和 


decr name 


同样 ，name 表 示 任 何 变量 名 。 第 一 条 语句 使 标识 的 变量 值 增加 1。 这 样 一 来 ， 如 果 变 量 Y 原 来 的 
值 为 5， 那 么 执行 语句 

A 
后 ， 赋 给 变量 Y 的 值 就 变 为 6。 

相反 ，decr 语 句 被 用 来 将 标识 的 变量 值 减 1。 一 种 例外 的 情况 是 ， 当 变量 的 值 已 经 为 0 时 ， 
这 条 语句 将 保持 值 不 变 。 所 以 ， 如 果 变 量 Y 的 值 为 53， 那么 执行 语句 


decr Y 


后 ， 变 量 Y 所 赋 的 值 就 为 4。 然 而 ， 如 果 变 量 Y 的 值 已 经 为 0， 那 么 执行 这 条 语句 后 ， 该 变量 的 值 
仍 为 0。 
Bare Bones 语 言 只 提供 了 一 条 控制 结构 语句 ， 该 语句 由 while 表 示 。 语 句 序列 


while name not 0: 


(其 中 的 name 表 示 任 意 变量 名 ) 在 变量 name 不 为 0 的 情况 下 , 会 反复 执行 while 语 句 下 面 缩 进 的 
语句 或 语句 序列 。 更 为 准确 地 说 ， 在 程序 执行 期 间 遇 到 while 结 构 语 句 时 ， 所 标识 变量 的 值 首 
先 和 0 进行 比较 : 如 果 值 为 0， 则 跳 过 此 结构 ， 继 续 执 行 缩 进 循环 体 后 面 的 语句 ， 然 而 ， 如 果 变 
量 的 值 不 为 0， 那 么 就 执行 while 结 构 中 的 缩 进 语句 序列 ， 并 且 控 制 回 到 while 语 句 ， 于 是 再 进 
行 比较 。 注 意 ， 程 序 员 要 担 起 循环 控制 的 一 部 分 责任 ， 为 了 避免 陷入 无 限 循环 ， 程 序 员 必须 在 
循环 体 中 明确 要 求 改变 变量 的 值 。 例 如 ， 语 句 序列 

incr X 


while X not 0: 
4NGFK 加 


将 会 导致 一 个 无 穷 的 循环 过 程 ， 这 是 因为 一 旦 到 达 while 语 句 ，Xx 的 值 永 远 不 会 为 0。 而 语 
句 序列 


aE 芝 clear 2 
¢ while X not 0: 
while X not 0: cleéar W 
iner 2 while Y not 0: 
decr X incr £2 
最 终 会 停止 。 该 语句 的 作用 是 将 x 的 初始 值 转移 给 变量 z。 ttt: 
可 以 观察 出 ， while 语 句 可 以 出 现在 被 另 一 个 while 语 句 重复 执 while W not 0: 
行 的 结构 中 。 在 这 种 情况 中 ， 多 级 缩 进 将 指示 哪些 指令 属于 内 部 嵌 incr Y 
套 的 while 语 句 的 循环 体 。 J 


decr X 





最 后 一 个 例子 是 图 12-10 中 的 指令 序列 ,该 序列 执行 的 结果 是 将 X 和 Y 
的 值 的 乘积 赋 给 2， 虽 然 有 一 个 副作用 ， 即 会 破坏 已 经 赋值 给 x 的 任何 非 ” 图 12-10 一 个 用 于 计算 
零 值 。( 由 变量 w 控 制 的 while 结 构 起 到 了 恢复 Y 的 初始 值 的 作用 。) XXY 的 Bare Bones 程 序 
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12.3.2 ”用 Bare Bones 语 言 编程 


记 住 ， 我 们 提出 Bare Bones 语 言 的 目的 就 是 要 研究 什么 是 可 能 的 ， 什 么 是 不 切实 际 的 。 事 
实证 明 ， 在 实用 的 场合 使 用 Bare Bones 语 言 不 太 合 适 。 男 一 方面 ， 我 们 将 很 快 看 到 ， 这 种 简单 
的 语言 达到 了 我 们 的 目的 ， 即 它 提供 了 一 种 基本 的 通用 程序 设计 语言 。 在 这 里 ， 我 们 只 是 要 说 
明 一 下 如 何 用 Bare Bones 语 言 来 表示 一 些 基本 的 操作 。 

我 们 首先 注意 到 ， 运 用 几 个 赋值 语句 的 组 合 可 以 把 任何 值 〈 任 何 非 负 整 数 ) 赋 给 一 个 指定 
的 变量 。 例 如 ， 下 列 语 名 序列 能 把 值 3 赋 给 变量 x， 具 体 步 骤 是 先 将 值 0 赋 给 Xx， 然 后 对 其 值 进行 
三 次 递增 操作 : 

clear X 

AGE 站 

二 GE ZX 


TnEE -区 


程序 中 另 一 种 常见 的 活动 就 是 将 数据 从 一 个 地 方 复制 到 另外 一 个 地 方 。 就 Bare Bones 
语言 而 言 ， 这 就 意味 着 我 们 需要 能 够 将 一 个 变量 的 值 赋 给 另外 一 个 变量 。 有 具体 可 以 这 样 来 
实现 : 先 将 目标 变量 清 0， 然 后 对 其 进行 合适 次 数 的 递增 操作 。 事 实 上 ， 我 们 已 经 看 到 ， 
语句 序列 
Clear ¥ 
while X not 0: 
incr Z 
decr X 


把 x 的 值 转移 到 了 z。 然 而 ， 这 个 语句 序列 还 有 一 个 副作用 ， 即 破坏 了 Xx 的 初始 值 。 为 了 避免 这 
种 破坏 ， 可 以 引入 一 个 辅助 变量 ， 先 将 对 象 的 值 从 其 初始 位 置 转移 至 这 个 辅助 变量 。 于 是 ， 我 
们 就 可 以 将 这 个 辅助 变量 作为 数据 源 ， 并 从 中 恢复 初始 的 变量 ， 同 时 将 变量 的 值 放 至 所 要 求 的 
目标 位 置 上 。 通过 这 种 方式 , 图 12-11 所 示 的 语句 序列 实现 了 











Clear Aux 


Today 到 Yesterday 的 转移 。 clear Tomorrow 
我 们 采用 语法 while Today not 0: 
incr Aux 


copy namel to name2 


decr Today 
(这 里 name1 和 name2 都 表示 变量 名 ) 作为 一 种 简略 的 符号 ， We 
用 来 表示 图 12-11 所 示 的 语句 结构 。 这 样 一 来 ， 尽 管 Bare incr Today 


incr Tomorrow 





Bones 语 言 本 身 没有 明确 的 copy 指 令 ， 但 是 在 写 程序 的 时 候 
就 好 像 有 这 样 的 指令 。 而 这 里 需要 理解 的 是 ， 要 将 这 种 非 正 
式 的 程序 转化 成 实际 的 Bare Bones 语 言 程序 ， 必 须 把 copy 语 ”图 12-11 实现 指令 “copy today to 
句 用 其 等 价 的 while 结 构 来 代替 ， 并 且 所 使 用 的 辅助 变量 名 。 tomorow ”的 Bare Bones 语 汪 序 到 
不 要 与 程序 中 其 他 地 方 已 经 用 过 的 名 字 相 冲 突 。 


12.3.3 Bare Bones 的 通用 性 


现在 就 让 我 们 来 应 用 丘 奇 -图 灵 论 题 来 证 明 我 们 的 论断 ， 即 Bare Bones 语 言 是 一 种 通用 程序 设 
计 语 言 。 首 先 ， 可 以 看 到 ， 任 何 用 Bare Bones 语 言 编写 的 程序 都 能 看 作 是 对 一 个 函数 计算 的 指导 。 
函数 的 输入 包含 的 是 程序 执行 前 赋予 变量 的 值 ， 并 且 函 数 的 输出 包含 的 是 程序 结束 时 变量 的 值 。 
要 计算 这 个 函数 , 我 们 只 需 从 变量 的 适当 赋值 开始 执行 这 个 程序 , 然后 观察 程序 终止 时 变量 的 值 。 
在 这 些 条 件 下 ， 程 序 


decr Aux 
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指导 计算 的 函数 和 12.2 节 中 图 灵机 例子 的 那个 函数 (后 继 函 数 ) 相同。 事实 上 ， 它 就 是 将 x 的 值 
增加 1。 同 样 ， 如 果 将 变量 x 和 Y 解 释 成 输入 ， 而 将 变量 z 作 为 输出 ， 那 么 程序 
Copy Y to 2 
while X not 0: 
incr 2 
decr X 


指导 的 就 是 加 法 函数 的 计算 了 。 

研究 者 已 经 证 明 ，Bare Bones 程 序 设计 语言 能 够 用 来 表达 计算 所 有 图 灵 可 计算 函数 的 算法 。 
如 果 把 这 与 丘 奇 -图 灵 论 题 相 结合 ， 就 意味 着 任何 可 计算 函数 都 能 由 Bare Bones 语 言 编写 的 程序 
来 进行 计算 。 这 样 一 来 ，Bare Bones 语 言 就 是 一 种 通用 程序 设计 语言 。 从 这 个 意义 上 讲 ， 如 果 
存在 一 个 解决 问题 的 算法 ， 那 么 通过 某 个 Bare Bones 语 言 程 序 就 能 解决 这 个 问题 。 因 此 ， 理 论 
上 可 以 这 么 说 : Bare Bones 语 言 可 以 用 来 作为 一 种 通用 程序 设计 语言 。 

之 所 以 是 从 理论 上 讲 ， 是 因为 这 样 一 种 语言 当然 不 像 第 6 章 中 介绍 的 Python 或 高 级 语言 那 
样 方便 。 但 是 ， 每 种 高 级 语言 实质 上 都 包含 有 Bare Bones 语 言 的 特性 ， 并 将 其 作为 核心 。 实 际 
上 ， 正 是 这 个 核心 ， 才 保证 了 每 种 这 样 的 语言 的 通用 性 ， 而 各 种 语言 中 的 其 他 特性 都 是 为 了 
方便 使 用 才 引 入 的 。 

尽管 像 Bare Bones 之 类 的 语言 在 应 用 程序 设计 环境 中 并 不 实用 ， 但 在 计算 机 科学 的 理论 研 
究 中 还 是 能 找到 用 武之 地 的 。 例 如 ， 在 附录 E 中 ， 将 使 用 Bare Bones 语 言 作为 一 种 工具 来 解决 第 
5 章 所 提出 的 关于 迭代 结构 和 递归 结构 等 价 的 问题 。 事 实 上 ， 我 们 会 发 现 ， 这 种 等 价 性 的 猜测 证 
明 是 正确 的 。 


问题 与 练习 


1. 证 明 语 旬 invert Xx (此 语句 的 功能 是 : 如 果 X 的 初始 值 非 0， 那 么 就 把 x 的 值 转化 为 0;， 如 果 初 始 值 为 
0， 那 么 就 将 该 值 转化 为 1) 能 够 用 一 个 Bare Bones 程 序 段 来 进行 模拟 。 
证 明 即 使 简单 的 Bare Bones 语 言 也 包含 了 一 些 非 必 要 的 语句 ， 如 clear 语 句 能 利用 语言 中 别 的 语句 的 
组 合 来 代替 。 
证 明 if-else 结 构 能 够 由 Bare Bones 语 言 来 模拟 。 也 就 是 说 ， 用 Bare Bones 语 言 写 一 个 程序 序列 ， 用 来 模 
拟 以 下 语句 的 操作 : 
Lf-3 nn6e 0 

ST 
else: 

S82 


其 中 sl 和 52 表 示 的 是 任意 语句 序列 。 | 
4. 证 明 : 每 一 条 Bare Bones 语 句 都 能 用 附录 C 的 机 器 语言 来 表达 。( 所 以 Bare Bones 语 言 可 以 作为 这 样 一 
种 机 器 的 程序 设计 语言 。) 
. 怎样 用 Bare Bones 语 言 来 处 理 负数 ? 


3 


Ea 


on 


6. 描述 由 下 列 Bare Bones 程 序 计算 的 函数 ， 假 设 该 函数 的 输入 由 Xx 表示 ， 输 出 由 Zz 表示 。 
clear Z 
While X not 0: 
了 NG 世 
ne 2 


decr XxX 
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12.4 “一 个 不 可 计算 的 函数 


现在 ， 我 们 来 看 一 个 函数 ， 该 函数 不 是 图 灵 可 计算 的 ， 因 此 ， 依 据 丘 奇 -图 灵 论 题 ， 可 以 完全 
相信 它 在 一 般 意义 上 也 是 不 可 计算 的 。 这 样 一 来 ， 对 这 个 函数 的 计算 就 超出 了 计算 机 的 计算 能 力 。 


12.4.1 停机 问题 


我 们 要 讨论 的 是 与 这 个 不 可 计算 函数 相关 联 的 一 个 问题 ， 即 停机 问题 (halting problem)，( 简 
略 地 说 ) 这 个 问题 就 是 要 预先 预测 当 一 个 程序 在 某 些 条 件 下 开始 后 ， 是 否 能 够 终止 〈 或 者 说 是 
停止 )。 例 如 ， 考 虑 下 面 这 个 简单 的 Bare Bones 程 序 : 


while X not 0: 


inGr 里 


如 果 用 X 的 初始 值 0 来 执行 这 个 程序 ， 则 这 个 循环 体 将 不 会 执行 ， 并 且 程 序 的 执行 很 快 就 可 以 终 
止 。 但 是 ， 如 果 用 X 的 任意 其 他 初始 值 来 执行 这 个 程序 ， 那 么 这 个 循环 将 会 永远 执行 下 去 ， 这 样 
就 导致 了 一 个 不 可 终止 的 过 程 。 

于 是 ， 在 这 种 情况 下 就 不 难得 出 结论 : 只 有 当 X 的 初始 值 为 0 时 ， 该 程序 的 执行 才 会 终止 。 
然而 ， 如 果 考 虑 更 为 复杂 的 例子 ， 那 么 对 程序 执行 行为 的 预测 任务 就 变 得 更 加 复杂 了 。 事 实 上 ， 
在 某 些 情况 下 我 们 将 看 到 ， 这 种 预测 任务 几乎 不 可 能 完成 。 但 是 ， 我 们 首先 需要 做 的 是 规范 化 
术语 ， 并 使 想法 更 为 精确 。 

我 们 的 例子 已 经 表明 ， 一 个 程序 最 终 能 和 否 终 止 就 取决 于 其 变量 的 初始 值 。 这 样 一 来 ， 如 果 
我 们 想 预 测 一 个 程序 的 执行 是 否 能 终止 ， 那 么 必须 在 考虑 这 些 初 始 值 方面 要 做 到 比较 精确 。 为 
这 些 值 所 做 的 选择 粗 看 起 来 不 太 习 惯 ， 但 是 没有 关系 。 我 们 的 目标 是 利用 一 种 称 为 自 引 用 
(self-reference) 的 技术 ， 其 思想 是 一 个 对 象 引 用 自己 。 从 “这 条 语句 是 错误 的 ”这 样 的 句子 所 
表示 出 来 的 通俗 的 好 奇 心 ， 到 “所 有 集合 的 集合 是 否 包 含 其 自身 ? ”这 样 的 问题 所 表示 的 悖 论 ， 
这 种 手法 在 数学 上 已 经 多 次 导致 了 令 人 吃惊 的 结果 。 那 么 ， 我 们 所 要 做 的 就 是 建立 起 一 组 推理 
的 步骤 ， 而 这 些 步骤 就 类 似 于 :“ 如 果 它 是 ， 那 么 它 就 不 是 ; 但 是 ， 如 果 它 不 是 ， 那 么 它 就 是 。” 

在 我 们 的 情况 中 ， 自 引用 是 这 样 来 实现 的 ， 即 给 程序 中 的 变量 赋 一 个 初 值 ， 而 这 个 值 就 表 
示 程 序 本 身 。 为 此 ， 我 们 注意 到 ， 每 个 Bare Bones 程 序 都 是 利用 ASCII 码 ， 以 每 字 节 一 个 字符 的 
方式 编码 成 单个 长 的 位 模式 ， 然 后 将 其 解释 为 一 个 〈 相 当 大 的 ) 非 负 整数 的 二 进 制 表 示 。 我 们 
赋 给 程序 中 变量 的 初始 值 正 是 这 个 整数 值 。 

现在 来 考虑 ， 如 果 在 下 面 这 个 简单 程序 的 情形 下 这 么 做 ， 会 有 什么 样 的 结果 : 

while X not 0: 

incr X 


在 这 里 ， 我 们 想 知道 ， 如 果 程 序 开 始 的 时 候 X 被 赋予 了 表示 程序 本 身 的 整数 值 ( 见 图 12-12)， 那 
么 执行 程序 后 会 发 生 什 么 情况 。 这 种 情况 下 ， 答 案 非 常 明显 。 这 是 因为 X 将 会 是 一 个 非 零 值 ， 而 
程序 就 因此 会 陷入 到 死 循环 中 。 男 一 方面 ， 如 果 用 下 面 的 程序 做 一 个 类 似 的 试验 : 

clear X 


while X not 0: 


ner OX 


因为 不 论 初始 值 为 多 少 ， 当 执行 到 while 结 构 时 ， 变 量 x 的 值 都 将 是 9， 这 样 程序 就 会 终止 。 
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We , 利用 ASCII 码 Wh te i 局 发 
,while X not 0: 将 程序 编码 为 ot | 





Uae 一 个 长 位 模式 
0 | 0111011101101000. . .0010000001011000 


L 








将 此 模式 赋值 给 X， 并 执行 程序 
图 12-12 ”测试 一 个 自 终 止 的 程序 


于 是 ， 可 以 作出 以 下 定义 : 如 果 程 序 中 所 有 的 变量 都 是 用 程序 自身 的 编码 表示 来 进行 初始 
化 的 ， 且 这 个 程序 的 执行 能 够 导致 一 个 终止 的 过 程 ， 那 么 这 个 Bare Bones 程 序 就 是 自 终止 的 
Cself-terminating )。 简 单 来 说 ， 如 果 一 个 程序 以 自身 作为 输入 开始 执行 且 能 终止 ， 那 么 这 个 程序 
就 是 自 终 止 的 。 因 而 ， 这 就 是 我 们 所 期 望 的 自 引 用 。 

注意 ， 一 个 程序 是 否 是 自 终 止 的 可 能 与 编写 这 个 程序 的 目的 无 关 。 它 仅仅 是 一 种 属性 ， 每 
个 Bare Bones 程 序 要 么 具有 这 种 属性 ， 要 么 不 具有 这 种 属性 。 也 就 是 说 ， 每 个 Bare Bones 程 序 要 
么 是 自 终止 的 ， 要 么 就 不 是 。 

现在 ， 可 以 以 一 种 更 为 精确 的 方式 来 描述 停机 问题 。 这 个 问题 就 是 确定 Bare Bones 程 序 是 
不 是 自 终 止 的 。 我 们 将 要 看 到 ， 通 常 来 说 没有 回答 这 个 问题 的 算法 。 也 就 是 说 ， 当 给 定 任何 一 
个 Bare Bones 程 序 时 ， 没 有 一 个 单一 的 算法 能 够 确定 这 个 程序 是 不 是 自 终止 的 。 因 此 ， 停 机 问 
题 的 解决 方案 超出 了 计算 机 的 能 

这 样 的 一 个 事实 ， 即 在 我 们 前 面 的 例子 中 看 上 去 已 经 解决 了 停机 问题 ， 而 现在 却 声称 停 
机 问题 是 不 可 解 的 ， 听 起 来 有 些 矛 盾 。 所 以 这 里 要 暂停 下 来 加 以 解释 。 前 面 例 子 中 所 用 到 的 
观察 法 只 对 那些 特定 的 情况 适用 ， 而 不 能 将 其 运用 到 所 有 的 情况 中 去 。 停 机 问题 所 要 求 的 是 
一 种 单一 的 、 一般 性 的 算法 , 并 能 够 用 在 任何 的 Bare Bones 程 序 中 , 以 确定 它 是 否 是 自 终 止 的 。 
这 里 ， 这 样 一 个 事实 ， 即 运用 某 些 孤 立 的 观察 能 力 来 确定 某 个 程序 是 否 为 自 终止 的 ， 并 不 意 
味 着 存在 着 一 个 单一 的 、 通 用 的 且 能 够 适用 于 所 有 情况 的 方法 。 简 而 言 之 ， 我 们 也 许 能 够 建 
造 出 能 够 解决 某 个 特定 停机 问题 的 机 器 ， 但 是 不 能 建造 出 一 个 单一 的 机 器 ， 使 之 能 用 来 解决 
出 现 的 任何 停机 问题 。 
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现在 ， 我 们 要 来 证 明 求 解 停机 问题 超出 了 机 器 的 能 力 。 我 们 的 方法 是 要 证 明 ， 解 决 这 类 问 
题 需要 一 个 用 来 计算 不 可 计算 函数 的 算法 。 所 涉及 函数 的 输入 是 Bare Bones 程 序 的 编码 版 本 ， 
其 输入 仅 限 于 值 0 和 1。 更 准确 地 说 ， 我 们 这 样 定义 这 个 函数 : 表示 一 个 自 终 止 程序 的 输入 就 产 
生 输 出 值 1， 而 表示 一 个 非 自 终止 程序 的 输入 则 产生 输出 值 0。 为 了 简明 起 见 ， 我 们 称 这 个 函数 
为 停机 函数 (halting function )。 

我 们 的 任务 就 是 要 证 明 : 停机 函数 是 不 可 计算 的 。 所 用 到 的 方法 是 “ 反 证 法 ”。 简 而 言 之 ， 
要 证 明 一 条 语句 为 假 ， 只 需 证 明 它 不 为 真 即 可 。 于 是 ， 证 明 语 句 “ 停 机 函数 是 可 计算 的 ”不 为 
真 。 我 们 的 整个 论据 都 概括 在 图 12-13 中 。 

如 果 停 机 函数 是 可 计算 的 ， 那么 (因为 Bare Bones 语 言 是 一 种 通用 程序 设计 语言 ) 一 定 存 
在 一 个 能 计算 该 函数 的 Bare Bones 程 序 。 换 句 话 说 ， 存 在 一 个 Bare Bones 程 序 ， 如 果 它 的 输入 是 
一 个 自 终止 程序 的 编码 版 本 , 那么 它 就 将 以 输出 值 等 于 1 而 终止 ; 否则 就 以 输出 值 等 于 0 而 终止 。 
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首先 : 提议 存在 一 个 程序 然后 : 如 果 存 在 这 样 的 程序 ， 那 么 现在 ， 如 果 新 程序 是 自 
终止 的 ， 并 且 












i 我 们 就 能 像 下 面 这 样 修改 它 
任何 编码 形式 | = 以 它 自己 的 铀 。 
1 二 丽人 中 提议 的 程序 作为 输入 开 
| 结构 | I 执行 到 达 这 一 点 ， 
的 本 | -= | we x ME Xx 等 于 1 
| | | not 0: | 提议 的 程序 
eR re 
若 输入 表示 一 个 自 
x 1 了 
则 以 x 等 于 0 停止 4 所 以 的 生 水运 隐 
也 就 是 说 ， 如 果 新 程 
序 是 自 终止 的 ， 那 么 
它 不 是 自 终止 的 ， 
然而 ， 如 果 这 个 新 程序 不 I i 
是 自 终止 的 ， 并 且 
以 它 自己 的 编 
作为 输入 结果 : 
执行 到 达 这 | 
RR | 提议 的 程序 存在 
“ed MA 
| = ] ma | 提议 的 程序 次 导致 
hile X 
0 ot 0: ,pp TE 
所 以 会 距 。 | | = 
过 此 循环 所 以 ， 提 议 的 程 


也 就 是 说 ， 如 果 新 程序 不 是 自 
终止 的 ， 那 么 它 是 自 终止 的 


图 12-13 ”证明 停机 程序 的 不 可 解 性 


为 了 用 这 个 程序 ， 我 们 并 不 需要 确认 哪个 变量 是 输入 变量 ， 而 只 需 把 程序 的 所 有 变量 初始 
化 为 被 测试 程序 的 编码 表示 即 可 。 这 是 因为 ， 如 果 一 个 变量 不 是 输入 变量 ， 那 么 它 的 初始 值 本 
质 上 是 不 会 影响 到 最 终 的 输出 值 的 。 所 以 ， 可 以 这 么 说 ， 如 果 停 机 函数 是 可 计算 的 ， 那 么 就 存 
在 下 面 这 样 一 个 Bare Bones 程 序 : 如 果 其 所 有 变量 都 初始 化 成 一 个 自 终止 程序 的 编码 版 本 ， 那 
么 它 将 以 输出 值 等 于 1 而 终止 ， 否 则 将 以 输出 值 等 于 0 终止 。 

假设 该 程序 的 输出 变量 名 为 X〈 如 果 不 是 ， 则 对 变量 进行 简单 的 更 名 即 可 )， 我 们 可 以 在 程 
序 的 最 后 加 上 以 下 的 语句 来 修改 这 个 程序 ， 从 而 产生 一 个 新 程序 : 


while X not 0: 


而 这 个 新 程序 必须 要 么 是 自 终止 的 ， 要 么 就 不 是 。 然 而 ， 我 们 将 会 看 到 ， 它 既 不 是 自 终止 的 ， 
也 不 是 非 自 终止 的 。 

具体 来 说 ， 如 果 这 个 新 程序 是 自 终止 的 ， 且 用 初始 化 为 该 程序 自身 的 编码 表示 的 变量 来 
执行 这 个 程序 ， 那 么 当 它 执行 到 我 们 所 加 的 while 语 句 时 ， 变 量 x 将 为 1。( 在 这 一 点 上 ， 这 个 
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新 程序 与 原始 程序 一 样 ， 如 果 其 输入 是 一 个 自 终 止 程序 的 表示 ， 那 么 就 会 产生 一 个 1。) 在 这 
一 点 ， 程 序 的 执行 将 会 始终 陷入 在 while 结 构 中 ， 因 为 在 这 个 循环 中 没有 提供 让 Xx 值 递减 的 措 
施 。 但 是 ， 这 与 关于 新 程序 是 自 终 止 的 假设 相 了 矛盾， 因此 ， 我 们 必然 得 出 结论 : 新 程序 不 是 
自 终 止 的 。 

然而 ， 如 果 这 个 新 程序 不 是 自 终止 的 ， 且 用 初始 化 为 该 程序 自身 的 编码 表示 的 变量 来 执行 
这 个 程序 ， 那 么 当 它 执行 到 我 们 所 加 的 while 语 句 时 ， 变 量 X 就 会 被 赋值 为 0。( 之 所 以 会 这 样 ， 
是 因为 在 该 while 语 句 之 前 的 语句 构成 的 原始 程序 ， 在 其 输入 表示 一 个 非 自 终止 程序 时 ， 输 出 
0。) 在 这 种 情况 下 ，while 结 构 中 的 循环 不 会 执行 ， 程 序 会 停 上 上 。 但 是 ， 这 正 是 自 终 止 程序 的 
特性 ， 所 以 ， 我 们 不 得 不 得 出 结论 : 该 新 程序 是 自 终 止 的 。 这 正如 早 些 时 候 我 们 不 得 不 认为 它 
不 是 自 终 止 的 。 

概括 来 说 ， 可 以 看 出 ， 我 们 遇 到 了 程序 中 的 一 个 不 可 能 的 情况 ， 即 一 方面 程序 必须 要 么 是 
自 终止 的 ， 要 么 不 是 ;而 另 一 方面 程序 又 必须 既 不 是 自 终 止 的 ， 又 不 是 非 自 终止 的 。 其 结果 是 ， 
导致 这 种 矛盾 的 假设 必定 不 成 立 。 

我 们 可 以 得 出 结论 : 停机 函数 是 不 可 计算 的 。 因为 停机 问题 的 解决 依赖 于 这 个 函数 的 计算 ， 
所 以 必然 得 出 结论 : 停机 问题 的 解决 超出 了 任何 算法 系统 的 能 力 范围 。 这 种 问题 被 称 为 不 可 解 
问题 (unsolvable problem ) 。 

最 后 ， 把 刚才 讨论 过 的 内 容 与 第 11 章 中 的 思想 联系 起 来 。 第 11 章 中 一 个 非常 基本 的 问 
题 就 是 计算 机 器 的 能 力 是 否 包含 智能 本 身 所 需要 的 能 力 。 回 想 一 下 ， 机 器 只 能 解决 使 用 算 
法 可 解 的 问题 ， 而 现在 已 经 发 现 有 些 问 题 使 用 算法 无 法 解决 。 因 此 ， 问 题 就 在 于 人 类 的 大 
脑 是 否 包含 了 比 执行 算法 过 程 更 多 的 东西 ? 如 果 没 有 ， 那 么 我 们 在 这 里 所 确定 出 的 局 限 性 ， 
也 就 是 人 类 思想 的 局 限 性 。 不 必 说 ， 这 是 一 个 极 具 争议 的 问题 ， 有 时 也 是 情绪 方面 的 问题 。 
例如 ， 如果 人 的 大 脑 只 不 过 是 编程 过 的 机 器 的 话 ， 那么 可 以 推断 出 ， 人 类 就 不 再 拥有 自由 的 
意志 。 


问题 与 练习 
1. 下 面 的 Bare Bones 程 序 是 自 终 目的 吗 ? 请 解释 你 的 答案 。 


TDET 站 
SSE 了 


2. 下 面 的 Bare Bones 程 序 是 自 终止 的 吗 ? 请 解释 你 的 答案 。 
copy X to Y 
< 
incn YY 
while X not 0: 

decr X 
decr X 
decr 工 
decr Y 
decr Y 
while y not. O's 


. 下 面 的 场景 有 什么 不 对 ? 
在 某 个 社区 里 ， 每 个 人 都 拥有 自己 的 房子 .社区 的 房屋 油漆 工 声称 ， 他 要 为 社 
区 内 所 有 没有 被 屋 主 自己 涂 过 的 房屋 进行 涂 漆 。( 提示 : 谁 来 涂 油漆 工 的 房屋 ? ) 
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12.5 ”问题 的 复杂 性 
在 12.4 节 中 ， 已 经 讨论 过 问题 的 可 解 性 。 本 节 我 们 关注 的 问题 是 一 个 可 解 的 问题 是 否 有 一 


个 实际 解 。 我 们 将 会 发 现 ， 有 些 问题 在 理论 上 是 可 解 的 , 但 由 于 过 于 复杂 ， 从 实际 的 观点 来 看 ， 
它们 是 无 解 的 。 


12.5.1 问题 复杂 性 的 度量 


我 们 首先 回 到 5.6 节 中 的 关于 算法 效率 的 研究 。 在 那里 ， 我 们 用 大 写 的 希腊 字母 @ 来 标记 ， 
并 根据 算法 执行 所 需 的 时 间 来 对 其 进行 分 类 。 我 们 发 现 ， 插 入 排序 算法 属于 @ (办 这 一 类 ， 顺 
序 查 找 算法 属于 @ (n), 而 二 分 搜索 算法 则 属于 @ (logzn)。 现在 , 利用 这 个 分 类 系统 来 帮助 我 们 
确定 问题 的 复杂 性 。 我 们 的 目标 是 开发 出 一 种 分 类 系统 ， 使 其 能 告诉 我 们 哪些 问题 比 另 一 些 问 
题 更 为 复杂 ， 并 最 终 确 定 出 哪些 问题 太 过 复杂 ， 以 致 实际 上 不 能 解 。 

我 们 现在 的 研究 之 所 以 是 基于 算法 效率 的 知识 ， 其 原因 在 于 希望 从 解 题 的 复杂 性 角度 来 衡 
量 一 个 问题 的 复杂 性 。 我 们 认为 : 简单 问题 有 简单 的 解法 ; 复杂 问题 就 没有 简单 的 解法 。 可 以 
注意 到 这 样 一 个 事实 ， 一 个 问题 有 一 个 复杂 的 解 并 不 一 定 意味 着 该 问题 本 身 很 复杂 。 毕 竟 ， 一 
个 问题 可 以 有 许多 解 ， 而 其 中 的 某 个 解 必然 会 复杂 些 。 所 以 ， 如 果 要 确定 一 个 问题 本 身 很 复杂 ， 
那么 就 需要 证 明 它 的 所 有 解 都 不 简单 。 

在 计算 机 科学 领域 中 ， 让 人 感 兴趣 的 问题 就 是 那些 机 器 能 够 解 的 问题 。 这 些 问 题 的 解 都 能 
明确 地 表示 为 算法 。 所 以 ， 问 题 的 复杂 性 取决 于 解决 该 问题 的 算法 的 特性 。 更 为 准确 地 说 ， 解 
决 一 个 问题 的 最 简单 算法 的 复杂 性 可 以 被 认为 是 该 问题 本 身 的 复杂 性 。 

但 是 ， 如 何 来 衡量 一 个 算法 的 复杂 性 呢 ?” 遗 憾 的 是 ， 术 语 复 杂 性 (complexity) 有 着 不 同 的 
解释 。 一 种 解释 就 涉及 一 个 算法 中 所 包含 的 判定 和 分 支 数量 。 如 果 按 照 这 种 理解 ， 那 么 一 个 复 
杂 的 算法 将 会 有 着 盘根错节 的 判定 和 分 支 。 这 种 解释 也 许 能 够 和 软件 工程 师 的 观点 相 一 致 ， 软 
件 工 程 师 对 与 算法 发 现 和 表示 相关 的 问题 感 兴趣 ， 但 是 这 并 没有 获得 从 机 器 的 观点 所 看 到 的 复 
杂 性 的 概念 。 机 器 在 选择 下 一 条 要 执行 的 指令 时 ， 其 实 并 没有 做 实际 的 判断 工作 ， 它 只 是 一 遍 
一 遍地 遵循 机 器 周期 ， 每 次 执行 的 都 是 程序 计数 器 所 给 出 的 指令 。 所 以 ， 机 器 能 够 执行 一 组 看 
上 去 很 杂乱 的 指令 ， 而 事实 上 ， 它 就 像 在 执行 一 串 简 单 有 序 的 指令 那样 轻松 。 所 以 ， 复 杂 性 的 
解释 倾向 于 度量 一 个 算法 在 表示 中 所 遇 到 的 难度 ， 而 不 是 算法 本 身 的 复杂 性 。 

从 机 器 的 角度 来 看 ， 能 够 更 为 准确 地 反映 算法 复杂 性 的 一 种 解释 是 ， 要 度量 执行 这 个 算法 
时 所 必须 完成 的 步骤 数 。 注 意 ， 这 个 数目 与 写 好 的 程序 中 所 出 现 的 指令 数目 是 不 一 样 的 。 其 循 
环 体 只 有 一 条 语句 , 但 是 其 控制 要 求 这 个 循环 体 执行 100 次 的 循环 ,在 它 被 执行 时 ， 就 相当 于 执 
行 100 条 指令 。 所 以 ， 这 样 一 个 例 程 被 认为 要 比 一 串 50 条 分 开 写 的 语句 更 为 复杂 ， 尽 管 后 者 在 书 
写 形式 上 显得 更 长 。 与 复杂 性 最 终 相 关 的 是 机 器 在 执行 一 个 解法 时 所 花 的 时 间 ， 而 不 是 用 来 表 
示 解 的 程序 的 大 小 。 

所 以 ， 如 果 一 个 问题 的 所 有 解 都 需要 大 量 的 时 间 ， 那 么 就 认为 这 个 问题 是 复杂 的 。 这 种 复 
杂 性 的 定义 称 为 时 间 复 杂 性 (time complexity)。 在 5.6 节 中 介绍 算法 效率 时 ， 我 们 已 经 间接 地 遇 
到 了 时 间 复 杂 性 这 个 概念 。 毕 竞 ， 对 算法 效率 的 研究 就 是 对 算法 时 间 复 杂 性 的 研究 ， 只 是 两 者 
是 对 立 的 。 也 就 是 说 ,“ 较 高 的 效率 ”等 于 “ 较 低 的 复杂 性 ”。 所 以 ， 从 时 间 复 杂 性 的 角度 看 ， 
在 解决 一 个 表单 搜索 问题 时 ， 顺 序 搜索 算法 (属于 O (n)) 要 比 二 分 搜索 算法 (属于 (log2n)) 
更 为 复杂 。 
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现在 ， 我们 运用 算法 复杂 性 方面 的 知识 来 获得 一 个 确定 问题 复杂 性 的 方法 。 在 解 一 个 问 
题 时 ， 如 果 存 在 一 个 算法 ， 其 时 间 复 杂 性 为 日 [CD))， 并 且 解 决 该 问题 的 其 他 算法 没有 比 这 更 
低 的 时 间 复 杂 性 ， 那 么 我 们 就 定义 这 个 问题 的 《时 间 ) 复杂 性 为 @ (f (n))， 这 里 f (n) 是 n 的 某 
个 数学 表达 式 。 也 就 是 说 ， 一 个 问题 的 〈 时 间 ) 复杂 性 定义 为 该 问题 的 最 优 解 的 〈 时 间 ) 复 
杂 性 。 但 是 ， 找 到 一 个 问题 的 最 优 解 和 确认 该 解 为 最 优 解 本 身 往往 就 是 一 个 难题 。 在 这 样 的 
情况 下 ， 大 @ 标记 的 变种 ， 称 为 大 0 标记 (big Onotation， 读 作 “big oh notation”)， 被 用 来 
表示 对 一 个 问题 的 复杂 性 的 了 解 程序 。 更 为 准确 地 说 ， 如 果 f (n) 是 n 的 某 个 数学 表达 式 ， 并 且 
如 果 一 个 问题 能 够 被 属于 (f(n)) 这 一 类 的 算法 所 解决 ， 那 么 我 们 就 说 ， 这 个 问题 是 属于 OGf 
(n)) 这 一 类 的 。 这 样 一 来 ， 如 果 说 一 个 问题 是 属于 OC (n)) 的 ， 那 么 也 就 意味 着 这 个 问题 有 一 
个 复杂 性 属于 @ (f(n)) 的 解 ， 但 是 它 可 能 还 有 更 优 解 。 

对 搜索 和 排序 算法 的 研究 告诉 我 们 ， 一 个 长 度 为 x 的 表 ( 我 们 只 知道 列表 预先 已 经 排序 好 ) 
的 搜索 问题 是 属于 O(logzn) 的 ， 这 是 因为 二 分 搜索 算法 能 够 解决 这 个 问题 。 而 且 ， 研究 人 员 已 
经 证 明 ， 搜 索 问题 确实 是 属于 (logzn) 的 ， 所 以 二 分 搜索 算法 就 代表 了 这 个 问题 的 最 优 解 。 相 
反 ,， 我 们 知道 ， 对 一 个 长 度 为 x 的 列表 (这 时 是 不 知道 列表 中 原始 值 的 分 布 情况 ) 的 排序 问题 就 
属于 O (mw)， 这 是 因为 是 用 插入 排序 算法 来 解决 这 个 问题 的 。 然 而 ， 知 道 排序 问题 是 属于 
@ (nlogyn)， 这 就 告诉 我 们 ， 插 入 排序 算法 不 是 最 优 解 ( 从 时 间 复 杂 性 的 角度 看 )。 

排序 问题 的 一 个 更 好 的 解决 办 法 是 归并 排序 算法 。 其 方法 是 将 表 的 一 些 较 小 的 、 排 序 过 的 
部 分 归并 成 较 大 的 、 排 序 好 的 部 分 ， 然 后 再 进行 归并 ， 得 到 更 大 的 排序 过 的 部 分 。 每 次 归并 过 
程 都 是 利用 在 介绍 顺序 文件 时 所 遇 到 的 归并 算法 〈 见 图 9-15)。 为 了 方便 ， 再 用 图 12-14 来 表示 ， 
而 这 次 的 情况 是 归并 两 个 列表 。 完 整 的 〈 递 归 ) 归并 排序 算法 可 由 图 12-15 中 所 示 的 MergeSort 
函数 来 表示 。 当 要 求 对 一 个 列表 排序 时 ， 这 个 过 程 首 先 检查 被 排序 的 列表 ， 看 其 是 否 少 于 两 个 
数据 项 : 如 果 是 ， 则 该 函数 的 任务 已 经 完成 ; 如 果 不 是 ， 则 这 个 函数 将 列表 分 成 两 部 分 ， 再 请 
求 函数 MergeSort 的 另外 一 个 副本 对 这 两 部 分 进行 排序 ， 然 后 将 这 些 排序 好 的 片段 合并 在 一 
起 ， 这 样 就 得 到 最 后 的 排序 过 的 列表 。 


def MergeLists(InpPUutListRAa，InputListB，OutputList) : 
if (两 个 输入 列表 为 空 ) : 
停止 ，OutputIist 为 空 
if (InputListA 为 空 ) : 
声明 它 被 用 完了 
else: 
声明 它 的 第 一 项 为 当前 项 。 
if (InputListB 为 空 ) : 
声明 它 被 用 完了 
else : 
声明 它 的 第 一 项 为 当前 项 。 
while (两 个 输入 表 都 没有 用 完 ) : 
把 “ 较 小 的 ”当前 项 放 入 OutputList 
if (该 当前 项 是 对 应 输入 表 的 最 后 一 项 ) : 
声明 该 输入 表 被 用 完了 
else: 
声明 该 输入 表 的 下 一 项 为 该 表 的 当前 项 
从 未 完 的 输入 表 中 的 当前 项 开始 ， 将 剩 下 的 项 复制 到 0utputList 





图 12-14 用 来 合并 两 个 列表 的 MergeLists 函 数 
为 了 分 析 这 个 算法 的 复杂 性 , 首先 来 考虑 在 合并 一 个 长 度 为 7 的 列表 和 一 个 长 度 为 的 列表 时 ， 
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必须 要 在 列表 的 数据 项 之 间 进 行 比较 的 次 数 。 归 并 过 程 是 这 样 进行 的 : 重复 地 对 一 个 列表 中 的 数 
据 项 与 另 一 个 列表 中 的 数据 项 进行 比较 ， 然 后 将 两 者 中 的 “ 较 小 项 ” 放 入 到 输出 列表 中 。 这 样 一 
来 , 每 做 一 次 比较 ， 那 么 还 要 考虑 的 数据 项 的 数目 就 要 减 1。 由 于 开始 时 只 有 r+s 个 数据 项 ， 那 么 
我 们 就 可 以 得 出 结论 : 这 两 个 列表 的 归并 过 程 所 包含 的 比较 次 数 不 会 多 于 r +s 次 。 
def MergeSort (List): 
if (List 有 多 项 ): 
MergeSort (List 的 前 半 部 分 ) 


MergeSort (List 的 后 半 部 分 ) 
MergeLists (List 的 前 半 部 分 和 后 半 部 分 ) 生 成 一 个 已 排序 的 List 








图 12-15 ”实现 为 函数 MergeSort 的 归并 排序 算法 
现在 来 考虑 完整 的 归并 排序 算法 。 它 是 通过 这 样 的 方式 来 处 理 一 个 长 度 为 n 的 列表 的 排序 工 
作 的 , 即将 最 初 的 排序 问题 简化 为 两 个 相对 较 小 的 问题 , 每 个 问题 是 要 对 一 个 长 度 约 为 /2 的 列表 
进行 排序 , 接 下 来 再 对 这 两 个 问题 进行 分 割 , 使 其 成 为 4 个 对 长 度 约 为 m/4 的 列表 进行 排序 的 问题 。 
这 种 分 割 过 程 可 以 由 图 12-16 中 的 树 结构 来 概括 , 图 中 树 的 每 个 节点 表示 的 是 递归 过 程 中 的 一 个 问 
题 ， 节 点 下 面 的 分 支 表 示 的 是 从 这 个 父 节 点 衍生 而 来 的 更 小 的 问题 。 所 以 ， 我 们 可 以 发 现 ， 将 树 
中 各 个 节点 上 发 生 的 比较 次 数 加 起 来 ， 就 能 得 到 整个 排序 过 程 中 所 发 生 的 总 的 比较 次 数 。 


对 m 个 名 字 
的 列表 排序 
对 列表 的 对 列表 的 
前 一 半 排 序 后 一 半 排 序 
对 列表 的 对 列表 的 对 列表 的 对 列表 的 


第 一 个 地 排序 ”第 二 个 二 排序 第 三 个 十 排序 ”第 四 个 二 排序 


图 12-16 ”由 归并 排序 算法 产生 的 问题 的 层次 结构 
首先 ， 我 们 来 确定 树 的 每 层 上 所 进行 的 比较 次 数 。 可 以 看 出 ， 出 现在 树 的 任意 一 层 的 每 个 
节点 ， 其 任务 都 是 对 初始 列表 的 一 个 特定 段 进行 排序 。 这 个 工作 由 归并 过 程 来 完成 ， 因 此 正如 
我 们 已 经 指出 过 的 ， 所 要 求 的 比较 次 数 不 会 多 于 该 列表 段 中 的 数据 项 的 数 。 因 而 ， 树 的 每 一 层 
所 需 的 比较 次 数 不 会 多 于 该 列表 段 中 的 数据 项 的 总 数 ， 而 且 ， 因 为 树 中 所 给 定 的 一 个 层 的 段 表 
示 的 是 初始 列表 所 分 割 的 部 分 ， 因 而 这 个 总 数 不 会 比 初始 列表 的 长 度 大 。 因 此 ， 树 的 每 一 层 所 
包含 的 比较 次 数 都 不 会 多 于 m。 (当然 ， 最 底层 所 包含 的 排序 列表 的 长 度 小 于 2， 因 而 根本 就 不 需 
要 比较 了 。) 
现在 来 确定 树 中 的 层 数 。 为 此 ， 可 以 看 到 ， 把 问题 分 割 成 更 小 的 问题 这 个 过 程 一 直 进 行 到 
所 得 到 的 列表 的 长 度 小 于 2 为 止 。 这 样 一 来 ， 树 中 的 层 数 就 由 分 割 的 次 数 所 确定 ， 从 值 z 开 始 ， 
反复 除 以 2， 直 到 其 结果 不 大 于 1， 那 么 这 个 次 数 就 是 logzmz。 更 为 准确 地 说 ， 树 中 所 涉及 的 比较 
层 数 不 多 于 flogzz]， 这 里 ， 标 记 flogzz] 表 示 的 是 将 log2z 的 值 向 上 取 整 。 
最 后 ， 把 树 中 每 层 所 做 的 比较 次 数 乘 以 涉及 比较 操作 的 层 数 ， 这 样 就 得 到 了 在 对 长 度 为 n 的 
列表 进行 排序 时 ， 归 并 排序 算法 所 做 的 总 的 比较 次 数 。 可 以 确定 ， 这 个 次 数 不 大 于 nllogzn1。 因 为 
nllogzn1 对 应 的 图 形 与 alogan 对 应 的 图 形 在 形状 上 大 臻 一样， 我 们 就 可 以 得 出 结论 ， 归并 排序 算 
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法 是 属于 O(nlogzn) 的 。 把 这 个 结论 与 研究 人 员 告 诉 我 们 的 排序 问题 的 复杂 性 为 @ (nlogzn) 这 个 事 
实 相 结合 ， 这 就 意味 着 归并 排序 算法 代表 了 排序 问题 的 一 个 最 优 解 。 





和 
杂 性 ， 我们 将 这 种 度量 方法 称 为 空间 复杂 性 ( space complexity )。 也 就 是 说 , 一 个 问题 的 空间 
复杂 性 是 由 解决 该 问题 所 需 的 存储 空间 的 数量 决定 的 。 文中 我 们 已 经 看 到 , 一 个 有 n 个 数据 项 
的 列表 的 排序 复杂 性 是 O(nlgn)。 而 这 个 问题 的 空间 复杂 性 将 不 超过 O(n+1)=O(n)。 要 知道 ， 利 
用 插入 排序 对 一 个 有 n 个 数据 项 的 列表 进行 排序 ， 除 了 需要 存放 列表 本 身 的 空间 ， 还 需要 1 个 
存放 临时 数据 项 的 空间 。 这 样 一 来 ， 如 果 要 对 越 来 越 长 的 表 进行 排序 ， 那 么 将 会 发 现 ， 每 个 任 
务 所 需 的 时 间 比 所 需 的 空间 增长 要 快 得 多 。 事 实 上 ， 这 是 一 个 很 常见 的 现象 。 因 为 利用 空间 也 
要 花费 时 间 ， 所 以 一 个 问题 的 空间 复杂 性 永远 不 会 比 它 的 时 间 复 杂 性 增长 得 更 快 。 

通常 会 在 时 间 复 杂 性 和 空间 复杂 性 之 间 做 出 一 些 折 中 。 在 某 些 应 用 场合 中 ， 为 了 方便 会 
事先 进行 某 些 计算 ， 并 将 计算 结果 以 表 的 形式 存放 起 来 ， 这 样 一 来 ， 在 需要 时 就 能 通过 表 很 
快 地 检索 到 。 这 样 一 种 “ 查 表 ”技术 实际 上 是 通过 表 所 需 的 额外 空间 的 代价 来 换取 获取 数据 
所 需 时 间 的 减少 。 另 一 方面 ， 通 常用 数据 压缩 来 减少 对 存储 空间 的 需求 ， 其 代价 是 数据 压缩 
和 和 解压 缩 所 需要 的 额外 时 间 。 


12.5.2 ”多 项 式 问 题 与 非 多 项 式 问题 


假设 f (n) 和 g(n) 是 数学 表达 式 。 如 果 要 说 ge(n) 是 受 f(n) 约 束 的 ， 那 么 这 就 表示 当 把 这 些 表 达 式 用 在 
越 来 越 大 的 n 值 上 时 ，f(n) 的 值 最 终 将 会 大 于 g(n) 的 值 ， 并 且 对 所 有 更 大 的 n 值 ，f (nm) 都 将 大 于 g(n)。 换 
人 句 话 说 ， 如 果 g(n) 受 f(n) 的 约束 ， 那 么 也 就 意味 着 对 于 “ 较 大 ”的 n 值 ，f(n) 的 图 像 将 会 在 e(n) 的 图 像 之 
上 。 例如， 表达 式 logyn 受 表达 式 n 的 约束 〈 见 图 12-17a)， 而 nlogyn 受 rr 的 约束 ( 见 图 12-17b)。 








n n 
(a)n 与 0g，n (b) n2 与 mlog2 


图 12-17 ”数学 表达 式 x、logzn、nlogyn 和 er 的 图 像 


如 果 一 个 问题 是 属于 O(f(n)) 的 ， 其 中 ， 表 达 式 f(n) 要 么 本 身 是 一 个 多 项 式 ， 要 么 就 是 受 
一 个 多 项 式 约束 ， 那 么 我 们 就 说 ， 这 个 问题 是 一 个 多 项 式 问题 (polynomial problem )。 所 有 多 
项 式 问 题 的 集合 用 P 表 示 。 注 意 ， 前 面 的 讨论 告诉 我 们 ， 列 表 的 搜索 和 排序 问题 就 属于 P。 

说 一 个 问题 是 多 项 式 问题 , 这 就 是 关于 解决 该 问题 所 需 时 间 的 一 种 陈述 。 我 们 经 常会 说 到 ， 
P 中 的 问题 能 够 在 多 项 式 时 间 范 围 解决 ， 或 者 说 ， 该 问题 有 多 项 式 的 时 间 解 。 确 定 出 属于 P 的 问 
题 是 计算 机 科学 中 非常 重要 的 课题 ,这 是 因为 ,这 个 问题 与 问题 是 否 有 实际 解密 切 相 关 。 确实 ， 
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P 类 之 外 的 问题 ， 其 特征 都 是 具有 极 长 的 执行 时 间 ， 即 使 是 对 中 等 规模 的 输入 也 是 如 此 。 例 如 ， 
考虑 一 个 求解 需要 2" 步 的 问题 。 指 数 表达 式 2" 不 受 任何 多 项 式 的 约束 ， 也 就 是 说 ， 如 果 f (n) 是 一 
个 多 项 式 ， 那 么 ， 当 增加 n 的 值 时 ， 我 们 就 会 发 现 ，2” 的 值 最 终 会 大 于 f (n) 的 值 。 这 就 意味 着 ， 
如 果 一 个 复杂 性 为 @ (2”) 的 算法 通常 会 比 复杂 性 为 @ (Nn)) 的 算法 效率 低 ， 因 而 就 需要 更 多 的 时 
间 。 如 果 一 个 算法 的 复杂 性 是 用 指数 表达 式 来 确定 的 ， 那 么 就 说 该 问题 需要 指数 时 间 。 

下 面 介绍 一 个 具体 的 例子 ， 考 虑 这 样 一 个 问题 ， 即 从 2 个 人 组 成 的 群体 中 ， 列 出 所 有 可 能 的 
小 组 组 合 。 因 为 这 里 可 以 有 2”-1 种 这 样 的 小 组 (这 里 可 以 允许 一 个 小 组 包含 所 有 的 人 ,但 是 不 
允许 小 组 中 没有 人 )， 所 以 解决 此 问题 的 任何 算法 必须 至 少 有 2”-1 步 ， 这 样 一 来 ， 其 复杂 性 也 至 
少 这 么 大 。 但 是 ， 表 达 式 2”-1 作 为 一 个 指数 表达 式 ， 不 受 任何 多 项 式 的 约束 。 所 以 ， 随 着 可 选 
人 群 规模 的 增加 ， 这 个 问题 的 任何 解 都 会 变 得 极为 费时 。 

上 面 的 分 组 问题 ， 其 复杂 性 非常 大 ， 这 只 是 因为 它 的 输出 规模 太 大 ， 而 与 此 不 同 的 是 ， 存 
在 着 这 样 的 一 些 问 题 ， 虽 然 它们 最 终 的 输出 只 是 是 或 否 这 样 简 单 ， 但 是 其 复杂 性 却 非常 大 。 一 
个 例子 就 是 能 不 能 回答 涉及 实数 加 法 的 一 些 语句 的 真实 性 问题 。 例 如 ， 对 于 “存在 一 个 实数 ， 
当 自 身 相 加 时 就 得 到 值 6。 这 是 真 的 吗 ? ”这 样 的 一 个 问题 ， 我 们 就 很 容易 得 到 答案 ， 即 答案 为 
真 。 而 对 “存在 一 个 非 零 实 数 ， 当 自身 相 加 时 就 得 到 值 0。 这 是 真 的 吗 ? ”这 样 的 一 个 问题 ， 显 
然 答 案 为 假 。 然 而 ， 当 碰 到 这 类 问题 越 来 越 多 时 ,我 们 回答 这 些 问 题 的 能 力也 就 会 开始 减弱 了 。 
如 果 发 现 自己 要 面 对 许多 这 样 的 问题 ， 那 么 我 们 就 可 能 尝试 着 求助 于 计算 机 程序 。 遗 憾 的 是 ， 
回答 这 类 问题 的 能 力 已 经 证 明 需 要 指数 时 间 ， 所 以 ， 随 着 所 涉及 的 这 类 问题 越 来 越 多 ， 最 终 的 
结果 是 ， 即 使 是 计算 机 也 做 不 到 以 一 种 实时 的 方式 给 出 答案 。 

理论 上 可 解 但 不 属于 P 的 问题 有 着 巨大 的 时 间 复 杂 性 ,这 一 事实 使 得 我 们 得 出 结论 : 从 实践 
角度 看 ， 这 些 问 题 本 质 上 是 不 可 解 的 。 计 算 机 科学 家 称 这 类 问题 为 难 解 型 〈intractable) 问题 。 
从 而 ,类 型 P 成 为 了 用 来 区 别 难 解 的 问题 与 那些 可 能 有 实际 解 的 问题 之 间 的 一 个 重要 分 界线 。 因 
此 ， 对 类 型 P 的 理解 已 经 成 为 了 计算 机 科学 领域 的 一 个 重要 研究 内 容 。 


12.5.3 ”NP 问题 


现在 来 考虑 旅行 商 问题 (traveling salesperson problem )， 该 问题 中 涉及 了 一 个 旅行 商 ， 她 必 
须要 访问 到 不 同城 市 的 每 个 客户 ， 其 花费 不 能 超出 她 的 出 差 预算 。 所 以 ， 她 的 问题 就 是 要 找到 
一 条 路 径 (从 她 的 家 里 出 发 , 遍历 有 关 的 城市 , 然后 再 返回 她 家 ), 其 总 长 度 不 超过 允许 的 里 程 。 

这 个 问题 的 传统 解决 办 法 是 这 样 的 ， 以 系统 化 的 方式 来 考虑 各 种 可 能 的 路 径 ， 然 后 把 每 条 
路 径 的 长 度 与 里 程 的 限制 数 相 比 较 ， 直 到 找到 一 条 可 接受 的 路 径 ， 或 者 是 把 所 有 可 能 的 路 径 都 
考虑 到 。 然 而 ， 这 种 方法 并 不 能 产生 一 个 多 项 式 时 间 解 。 随 着 城市 数目 的 增加 ， 所 要 测试 的 路 
径 数目 比 任何 多 项 式 增长 得 都 要 快 。 因 此 ， 在 所 涉及 城市 的 数目 很 多 的 情况 下 ， 按 照 这 种 方式 
来 解决 旅行 商 问题 是 不 实际 的 。 

我 们 可 以 得 出 结论 : 如 果 要 在 一 个 合理 的 时 间 范 围 内 解决 旅行 商 问 题 ， 必 须要 找到 一 个 更 
快 的 算法 。 如 果 存 在 着 一 个 令 人 满意 的 路 径 ， 并 且 碰 巧 一 开始 就 选择 了 这 条 路 径 ， 所 提出 的 算 
法 也 能 很 快 地 终止 ， 那 么 这 样 就 吊 起 了 我 们 的 胃口 。 有 具体 来 说 ， 下 面 的 指令 序列 能 够 很 快 地 执 
行 ， 并 且 也 有 解决 这 个 问题 的 潜力 : 

取 一 个 可 能 的 路 径 ， 并 计算 其 总 距离 。 

if (此 距离 不 大 于 允许 的 里 程 数 ) : 

宣布 找到 。 
else: 


宣布 没 找到 。 
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然而 ， 从 技术 意义 上 讲 ， 这 组 指令 不 是 一 个 算法 。 它 的 第 一 条 指令 就 比较 模糊 ， 原 因 在 于 
它 既 没有 指出 选择 的 是 哪 一 条 路 径 ， 又 没有 说 明 如 何 作 出 这 样 的 决定 。 相 反 ， 它 是 依赖 于 程序 
执行 机 制 的 创造 性 来 自己 做 决定 。 我 们 称 这 样 的 指令 为 非 确 定性 指令 , 并 将 包含 这 样 语句 的 “ 算 
法 ” 称 为 非 确 定性 算法 (nondeterministic algorithm )。 
”确定 性 的 和 非 确定 性 的 si 

在 许多 情况 下 ， 一 个 确定 性 “算法 ”和 一 个 非 确定 性 “算法 ”之 间 存 在 着 明显 的 界限 。 
这 种 差别 是 非常 清晰 和 明显 的 。 确 定性 算法 不 依赖 于 执行 该 算法 的 机 制 的 创造 性 能 力 ， 而 非 
确定 性 算法 可 能 会 依赖 。 例 如 ， 比 较 指 令 

走 到 下 一 个 十 字 路 口 ， 然 后 向 右 转 或 向 左 转 。 
与 指令 

走 到 下 一 个 十 字 路 口 ， 按 照 站 在 路 口 的 人 所 告诉 你 的 ， 向 右 转 或 向 左 转 。 


在 这 两 种 情况 中 ,这 个 人 在 真正 执行 指令 之 前 ， 所 采取 的 转向 行动 都 是 不 确定 的 。 然 而 ， 
第 一 条 指令 要 求 行人 根据 自己 的 判断 来 决定 其 转向 ， 所 以 这 条 指令 是 非 确定 性 的 。 第 二 条 指 
令 对 行人 所 要 转 的 方向 没有 做 这 样 的 要 求 ， 只 是 告知 行人 每 一 步 做 什么 。 如 果 有 几 个 不 同 的 
人 执行 第 一 条 指令 ， 那 么 有 些 人 会 向 右 转 ， 而 有 些 人 会 向 左 转 。 如 果 有 几 个 人 执行 第 二 条 指 
令 ， 并 且 得 到 同样 的 信息 ， 那 么 他 们 将 会 朝 一 个 方向 转 。 这 里 包含 了 确定 性 “算法 ”和 非 确 
定性 “算法 ”两 者 之 间 的 一 个 重要 区 别 。 如果 用 同样 的 输入 数据 反复 去 执行 一 个 确定 性 算法 ， 
那么 每 次 都 将 会 完成 同样 的 操作 。 然 而 ， 一 个 非 确定 性 “章法 ”在 同样 的 条 件 下 反复 执行 ， 
将 会 产生 不 同 的 操作 。 


注意 ， 随 着 城市 数目 的 增加 ， 执 行 上 述 非 确 定性 算法 所 需要 的 时 间 增 加 得 相对 较 慢 。 选 择 
一 条 路 径 的 过 程 仅 仅 是 产生 一 个 城市 清单 ， 这 能 够 在 与 城市 数目 成 比例 的 时 间 范 围 内 完成 。 而 
且 ， 沿 着 所 选择 的 路 径 ， 计 算 总 距离 所 需 的 时 间 也 与 所 访问 的 城市 数目 成 正比 ， 并 且 ， 将 这 个 
总 数 与 里 程 的 限定 数 进行 比较 所 需 的 时 间 与 城市 的 数目 无 关 。 于 是 ， 执 行 这 个 非 确定 性 算法 
所 需 的 时 间 就 受 一 个 多 项 式 约束 。 因 此 ， 就 有 可 能 在 多 项 式 时 间 内 ， 利 用 一 个 非 确 定性 算法 解 
决 旅行 商 问 题 。 

当然 ， 这 个 非 确定 性 解 并 不 能 令 人 十 分 满意 ， 因 为 它 依 赖 于 猜测 的 运气 。 但 是 ， 它 的 存在 
足以 表明 : 在 多 项 式 时 间 内 ， 对 旅行 商 问题 而 言 ， 存 在 着 一 个 确定 性 的 解 。 无 论 其 真 假 与 否 ， 
它 都 是 一 个 尚未 确定 的 问题 。 事 实 上 ， 有 许多 这 样 的 问题 ， 即 知道 它们 在 多 项 式 时 间 范 围 内 
执行 时 有 非 确定 性 解 ， 但 还 没 发 现 多 项 式 时 间 内 的 确定 性 解 ， 旅 行商 问题 就 是 这 些 问题 中 的 
一 个 。 对 于 这 些 问 题 的 非 确定 性 解 的 这 种 可 望 而 不 可 及 的 效率 ， 使 得 许多 人 希望 在 某 一 天 能 
找到 有 效 的 确定 性 解 ， 然 而 ， 大 多 数 人 相信 这 些 问题 太 复杂 ， 以 臻 超出 了 有 效 的 确定 性 算法 
的 能 力 范围 。 

一 个 能 够 在 多 项 式 时 间 内 用 非 确定 性 算法 解决 的 问题 , 称 为 非 确定 性 多 项 式 问题 Cnondeterministic 
polynomial problem )， 或 者 简称 NP 问 题 C(NP problem )。 习 惯 上 把 NP 类 问题 表示 成 NP。 注 意 ，P 
中 的 所 有 问题 也 都 属于 NP 问 题 ， 这 是 因为 任何 〈 确 定性 ) 算法 都 可 以 加 上 一 条 非 确定 性 指令 而 
不 影响 其 性 能 。 

然而 ， 正 如 旅行 商 问 题 所 说 明 的 ， 所 有 的 NP 问题 是 否 也 都 属于 P 问 题 还 是 个 尚未 确定 的 问 
题 。 在 今天 ， 这 也 许 是 计算 机 科学 领域 里 最 广为人知 的 未 解 问题 。 这 个 问题 的 解决 将 会 带 来 重 
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大 的 影响 。 例 如 ，12.6 节 我 们 将 讨论 到 ， 已 经 设计 出 来 的 加 密 系 统 其 完整 性 依赖 于 解决 问题 所 
需 的 大 量 时 间 ， 这 类 似 于 旅行 商 问题 。 如 果 证 实 了 对 这 样 的 问题 存在 着 有 效 解 ， 那 么 这 些 加 密 
系统 的 安全 性 就 将 受到 威胁 。 
为 了 解决 这 样 的 问题 〈 即 NP 类 问题 在 事实 上 是 否 等 同 于 P 类 问题 ) 而 作出 的 努力 ， 导 致 在 
NP 类 问题 中 发 现 了 一 类 称 为 NP 完 全 问题 (NP-complete problem) 的 问题 。 这 些 问题 都 具有 这 样 
一 种 特征 ， 即 任何 一 个 问题 的 多 项 式 时 间 解 也 为 所 有 其 他 NP 类 问题 提供 了 一 个 多 项 式 时 间 解 。 
也 就 是 说 ， 如 果 能 够 在 多 项 式 时 间 内 找到 一 个 (确定 性 ) 算法 ， 使 其 能 够 解决 一 个 NP 完 全 问题 ， 
那么 这 个 算法 就 能 推广 到 以 多 项 式 时 间 来 解决 任何 其 他 NP 类 问题 。 于 是 , NP 类 就 和 P 类 一 样 了 。 
旅行 商 问题 是 NP 完 全 问题 的 一 个 例子 。 
概括 来 说 ， 可 以 看 出 ， 问 题 可 以 分 为 可 解 有 一 个 算法 解 ) 和 不 可 解 〈 没 有 算法 解 ) 两 类 ， 
如 图 12-18 所 示 。 而 且 ， 可 解 问题 可 分 为 两 个 子 类 。 一 类 是 多 项 式 问题 的 集合 ， 该 集合 包含 了 有 
实际 解 的 那些 问题 。 -类 是 非 多 项 式 问 题 的 集合 ， 这 些 问题 只 有 当 输 入 相对 较 少 或 者 仔细 选 
取 的 情况 下 才 有 实际 解 。 最 后 ， 还 有 比较 难 理解 的 NP 问题 ， 至 今 还 没有 很 准确 的 分 类 。 
可 解 问题 不 可 解 问题 
= 上 = 和 








NP 问题 





多 项 式 问 题 非 多 项 式 问 题 
图 12-18 问题 分 类 的 一 个 概括 图 


问题 与 练习 

1. 假设 一 个 问题 能 够 通过 一 个 属于 @ (2”) 的 算法 求解 ， 那么 对 这 个 问题 的 复杂 性 ， 我 们 能 得 出 什么 样 的 

结论 ? 

2 假设 一 个 问题 能 够 通过 一 个 属于 OP ) 的 算法 求解 ， 电 可 以 通过 男 一 个 属于 9 的 和 法 求解 那么 
是 和 否 一 个 算法 总 是 要 优 于 另 一 个 算法 ? 

3. 如 果 一 个 委员 会 由 Alice 和 B 训 两 个 成 员 组 成 ， 那 么 请 列 出 这 个 委员 会 的 所 有 可 能 的 分 组 。 如 果 这 个 委 
员 会 是 由 Alice、B 记 和 Carol 组 成 ， 那 么 请 列 出 这 个 委员 会 的 所 有 可 能 的 分 组 。 如 果 这 个 委员 会 是 由 
Alice、Bill、Carol 和 David 组 成 的 ， 那 么 分 组 情况 又 会 怎样 ? 

4. 举 出 一 个 多 项 式 问 题 的 例子 。 举 出 一 个 非 多 项 式 问题 的 例子 。 举 出 一 个 尚未 被 证 明 是 多 项 式 问题 的 
NP 问 题 的 例子 。 

5. 如 果 算 法 X 的 复杂 性 比 算法 Y 的 大 ， 那 么 是 否 就 意味 着 算法 X 一 定 就 比 算法 Y 难 理解 ? 请 解释 你 的 答案 。 
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在 某 些 情况 下 , 某 个 问题 难以 解决 这 样 一 个 事实 已 经 不 再 是 一 个 缺点 , 而 变 成 了 一 个 优点 。 
特别 有 趣 的 一 个 问题 是 ， 为 一 个 给 定 的 整数 找到 它 的 因数 ， 如 果 这 样 的 解 确实 存在 ， 那 么 就 一 
定 要 为 这 个 问题 找到 一 个 有 效 的 解 。 例 如 ， 如 果 只 用 纸 和 笔 ， 你 将 会 发 现 ， 即 使 像 2 173 这 样 相 
对 较 小 的 数值 ， 要 找到 其 因数 也 比较 花 时 间 ， 而 如 果 涉及 的 数 大 到 需要 用 儿 百 位 数字 来 表示 ， 
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那么 即使 用 现在 最 好 的 因数 分 解 技术 ， 这 个 问题 也 还 是 难以 解决 。 

对 许多 数学 家 而 言 ， 至 今 还 没有 找到 一 种 有 效 的 方法 来 确定 大 整数 的 因数 ， 这 让 他 们 感到 
非常 不 安 。 然 而 ， 在 密码 学 领域 里 ， 这 种 情况 已 经 被 用 来 产生 一 种 对 报 文 进行 加 密 和 解密 的 流 
行 方法 。 这 种 方法 称 为 RSA 算 法 (RSA algorithm )， 选 择 这 个 名 字 是 为 了 对 该 算法 的 发 明 者 Ron 
Rivest、Adi Shamir 和 Len Adleman 表 示 尊 敬 。 这 种 方法 , 利用 一 组 称 为 加 密 密 钥 (encrypting key ) 
的 数值 对 报 文 进行 加 密 ， 并 利用 另 一 组 称 为 解密 密 钥 〈decrypting key) 的 数值 对 报 文 进行 解密 。 
知道 加 密 密 钥 的 人 可 以 对 报 文 进行 加 密 ， 但 是 不 能 对 报 文 进行 解密 。 只 有 持 有 解密 密 钥 的 人 才 
能 对 报 文 进行 解密 。 这 样 一 来 ， 加 密 密 钥 可 以 被 广泛 地 分 发 而 不 会 破坏 系统 的 安全 性 。 

这 样 的 密码 系统 称 为 公 钥 加 密 (public-key encryption) 系统 ， 这 个 术语 反映 了 用 来 对 报 文 
加 密 的 密 钥 可 以 公开 而 不 会 降低 系统 的 安全 性 。 事 实 上 ， 加 密 密 钥 通常 被 称 为 公 钥 (public key)， 
而 解密 密 钥 则 称 为 私 钥 (private key) ( 见 图 12-19 )。 


位 模式 形式 的 
报 文 用 公 钥 加 密 


用 私 钥 对 报 文 进行 解密 







因为 不 知道 私 钥 ， 所 以 
不 能 对 报 文 进行 解密 


图 12-19 ” 公 钥 密码 学 
12.6.1 模 表 示 法 


为 了 描述 RSA 公 钥 加 密 系统 ， 可 以 方便 地 采用 记号 x % m 来 表示 数值 x 被 m 除 后 所 得 的 余数 ， 这 
通常 读 作 “x modulo m” 或 “x mod m”。 这 样 一 来 ， 9 % 7 就 得 2， 因 为 9 二 7 的 余数 为 2。 类 似 地 ， 
24 % 7 为 3， 因 为 24 二 7 的 余数 为 3; 14 % 7 为 0， 因 为 14 二 7 的 余数 为 0。 注 意 ， 如 果 x 是 一 个 0 到 m-1 
的 整数 ， 那 么 x % m 的 值 就 为 x 本 身 。 例 如 ，4 % 9 的 值 就 为 4。 

借助 数学 知识 我 们 知道 ， 如 果 p 和 g 是 素数 ，m 是 0 到 pg (表示 p 和 gq 的 乘积 ) 的 一 个 整数 ， 那 
么 ， 对 于 任意 的 正 整 数 :， 就 有 

1 = mt Dg -Dopg 
尽管 在 这 里 不 证 明 这 个 命题 , 但 考虑 一 个 例子 来 解释 这 个 命题 还 是 有 必要 的 。 于是, 我 们 假设 p 
和 gq 分 别 为 素数 3 和 5， 并 且 m 为 整数 4。 那 么 ， 这 个 命题 说 ， 对 于 任意 的 正 整 数 k， 值 xi2 2 除 
以 15 (3 和 5 的 乘积 ) 将 得 到 余数 1。 上 有 具体 来 说 ， 如 果 酉 1， 那 么 
ZKP-IX9-D 三 4'3-1M5-D =4 =65536 

正如 前 面 所 讲 的 ， 该 值 除 以 15 所 得 余数 为 1 。 而 且 ， 如 果 k=2， 那 么 

mY = 4 0 =4° =4294 967296 
再 将 它 除 以 15 所 得 的 余数 为 1 。 事 实 上 ， 无 论 正 整 数 k 的 取 值 如 何 ， 都 将 得 到 余数 1。 
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现在 ， 我 们 准备 在 RSA 算 法 的 基础 上 构建 和 分 析 一 个 公 钥 加 密 系统 。 首 先 ， 选 出 两 个 不 
同 的 素数 p 和 q， 其 乘积 用 n 来 表示 。 然 后 ， 另 外 选 出 两 个 正 整 数 e 和 和 4， 使 得 对 于 某 个 正 整 数 k， 
满足 eXqd=k(p-1)(q-1) +1。 我 们 之 所 以 调用 值 e 和 和 4， 是 因为 它们 分 别 是 加 密 和 人 解密 过 程 的 组 
成 部 分 。( 事 实 上 ， 所 选取 的 值 e 和 cd 能 够 满足 前 面 的 等 式 ， 这 在 数学 上 也 是 另 一 个 已 经 证 明 过 
的 事实 ， 在 这 里 我 们 不 再 证 明 。) 

所 以 ， 这 里 选取 了 5 个 值 : p、g、n、e 和 4d。 值 e 和 n 是 加 密 密 钥 ， 值 4 和 nn 是 解密 密 钥 ， 值 p 
和 g 只 是 用 来 构建 加 密 系统 的 。 


这 里 就 考虑 一 个 具体 的 例子 来 进行 说 明 。 假 设 将 值 p 和 gq 分 别 选取 为 7 和 13， 那 么 
n=7 Xx13==91。 而 且 ， 将 值 e 和 4d 分 别 选取 为 5 和 29， 因 为 5x29=145=144 + 1 =2 (7-1) 
(13-1) +1=2 (p-1) (q-1)+1， 这 正 是 所 需 的 。 这 样 一 来 ， 加 密 密 铀 就 是 1=91 和 e=5， 
而 解密 密 钥 则 为 n=91 和 d=29。 我 们 将 加 密 密 钥 分 发 给 想 要 给 我 们 发 报 文 的 人 ， 而 解密 
密 钥 (以 及 p 和 gq 的 值 ) 我 们 自己 保留 。 


我 们 现在 来 考虑 如 何 对 报 文 进行 加 密 。 为 此 ， 假 设 当 前 的 报 文 是 按照 位 模式 (可 能 用 的 是 
ASCII 码 或 Unicode 码 ) 编码 的 ， 当 将 其 解释 为 二 进 制 表示 时 ， 这 个 位 模式 的 值 就 小 于 n。( 如 果 
它 不 小 于 m， 就 要 把 报 文 分 割 成 较 小 的 段 ， 然 后 分 别 对 每 段 进 行 加 密 。) 

假设 当 报 文 解释 为 二 进 制 表示 时 ， 我们 的 报 文 表示 值 m。 那 么 ， 这 条 报 文 的 加 密 形 式 就 
是 值 c = mr %n 的 二 进 制 表 示 。 也 就 是 说 ,加密 过 的 报 文 是 m 除 以 n 后 所 得 余数 的 二 进 制 表 示 。 

具体 来 说 ， 继 续 就 前 面 的 例子 来 进行 讨论 ， 如 果菜 人 想 要 用 加 密 密 钥 n =91 和 e = 5 

对 报 文 10111 进 行 加 密 ， 他 首先 会 看 出 ，10111 是 值 23 的 二 进 制 表 示 ,， 那么 计算 23° = 235 = 

6 436 343, 最 后 , 将 此 和 值 除 以 n= 91, 得 到 余数 为 4。 所 以 这 条 报 文 的 加 密 形式 就 是 100， 

即 为 4 的 二 进 制 表示 。 

为 了 解密 一 条 用 二 进 制 记 法 表示 的 值 为 c 的 报 文 ， 就 要 计算 ce % n 的 值 。 也 就 是 说 ， 计 算 
cs 的 值 ， 将 结果 再 除 以 x， 并 保留 所 得 的 余数 。 事 实 上 ， 这 个 余数 就 是 初始 报 文 的 值 n， 因 为 

Cc %n = m"™" Wn 


k(p-—1)(g—1)+1 
=m*? )(g )#+100672 





=mx m*‘?- MD) open 
= m%on 
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正如 前 面 所 述 ， 这 里 用 到 了 m2-09-D% n=m*2-04-D% pq=1， 以 及 m %n=m (因为 m 二 n)。 
继续 讨论 前 面 的 例子 ， 如 果 收 到 的 报 文 是 100， 那 么 我 们 就 能 识别 出 这 个 值 为 4， 
然后 计算 出 值 44 = 422 =288 230 376 151 711 744, 将 此 值 除 以 n=91， 从 而 得 到 余数 23， 
即 为 用 二 进 制 记 数 法 表示 的 初始 报 文 10111。 


概括 来 说 ， 一 个 RSA 公 钥 加 密 系 统 的 产生 过 程 是 这 样 的 ， 选取 两 个 素数 p 和 49， 再 从 这 两 个 
数 产 生 值 n、e 和 4q。 值 x 和 e 被 用 于 加 密 报 文 , 即 为 公 钥 ; 而 值 x 和 a 被 用 于 解密 报 文 , 即 为 私 钥 ( 见 
图 12-20)。 这 个 系统 的 优势 就 在 于 只 知道 如 何 加 密 报 文 ， 而 不 能 解密 报 文 。 这 样 一 来 ， 加 密 密 
钥 n 和 e 束 可 以 被 广泛 地 分 发 。 就 算 你 的 对 手 得 到 这 些 加 密 密 钥 ， 也 无 法 对 他 们 所 截获 的 报 文 进 
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行 解密 ， 因 为 只 有 知道 解密 密 钥 的 人 才能 对 报 文 进行 解密 。 










通过 对 p 和 gq 两 个 大 素数 的 
选取 来 确定 密 钥 na、e 和 ld 
性 





窗 钥 x 和 e 提 供给 任何 要 
对 报 文 进行 加 密 的 人 





p、9 和 qd 的 值 是 保密 的 


图 12-20 ”建立 一 个 RSA 公 钥 加 密 系 统 


这 种 系统 的 安全 性 的 基础 在 于 , 假定 只 知道 加 密 密 钥 x 和 e， 而 不 允许 计算 出 解密 密 钥 x 和 qd。 
然而 ， 确 实 有 这 样 的 算法 能 做 到 ! 一 种 方法 是 对 值 n 进 行 因 式 分 解 找到 p 和 gq， 然 后 找 一 个 k 值 ， 
使 得 k (p-1)(q-1) +1 被 e 整 除 ( 那 么 商 就 为 4)， 从 而 确定 4。 另 一 方面 ， 这 个 过 程 的 第 一 步 就 会 
很 耗 时 ， 特 别 是 在 所 选 的 p 和 g 很 大 的 情况 。 事 实 上 ， 如 果 p 和 gq 大 到 需要 用 儿 百 个 二 进 制 位 来 
表示 时 , 那么 即使 用 最 好 的 因 式 分 解 算 法 对 n 进 行 分 解 , 也 得 需要 好 几 年 的 时 间 才能 确定 p 和 9。 
因此 , 一 条 加 密 过 的 报 文 的 内 容 ， 即 使 其 重要 性 已 经 过 时 很 入 ， 它 的 安全 性 仍然 能 得 到 保证 。 

到 今天 ， 还 没有 人 能 够 在 不 知道 解密 密 钥 的 情况 下 ， 找 到 一 种 对 基于 RSA 密 码 学 加 密 的 报 
文 进行 解密 的 有 效 方法 ， 所 以 ， 基 于 RSA 算 法 的 公 钥 加 密 技 术 广泛 地 用 于 因特网 通信 ， 以 获取 
通信 的 秘密 性 。 


问题 与 练习 


1. 请 找 出 66 043 的 因数 。( 本题 可 能 比较 耗 时 ， 不 必 花 费 太 多 的 时 间 。) 
2. 用 公 钥 n= 91 和 e = 5 对 消息 101 进 行 加 密 。 
3. 用 私 钥 n = 91 和 性 29 对 消息 10 进 行 解密 。 ” 
4. 在 一 个 RSA 公 钥 密 码 学 系统 中 ， 根 据 素数 p = 7、4 =19 以 及 加 密 密 钥 e = 5， 为 解密 密 钥 z 和 d 找 出 合适 
的 值 。 





-一 一 一 一 一 一 一 一 -一 一 一 一 一 一 一 一 -一 一 一 -一 一 一 一 一 一 -一 二 一 一 一 -一 











复习 题 
1. 请 说 明 一 下 ， 如 何 用 Bare Bones 语 言 模 拟 如 下 将 变量 z 秆 为 0。 
结构 : 3. 写 一 个 Bare Bones 语 言 程序 , 将 变量 Zz 置 为 2 的 
while X equals 0: X 次 方 。 


上 上 


. 根据 以 下 每 种 情况 写 一 个 Bare Bones 语 言 程 
序 序列 ， 实 现 指定 的 活动 。 
a 如 果 x 的 值 为 偶数 ， 则 将 z 赋 值 为 0， 否 则 ， 
2. 写 一 个 Bare Bones 语 言 程序 ， 使 得 : 如 果 变 量 将 2 赋值 为 1。 
X 小 于 等 于 变量 Y， 则 将 变量 z 置 为 1， 否 则 ， b. 计算 整数 0 一 Xx 的 和 。 
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11. 


写 一 个 Bare Bones 语 言 例 程 ， 用 值 x 除 以 值 
Y， 忽 略 余数 。 也 就 是 说 ，1 除 以 2 得 9，5 除 
以 3 得 1。 
描述 由 下 列 Bare Bones 语 言 程 序 计算 的 函 
数 ， 假 设 该 函数 的 输入 由 x 和 Y 表 示 ， 和 输出 由 
Zz 表示 : 
Copy X to 2 
COPY Y to Aux 
while Aux not 0: 

decr 2 


decr Aux 


. 描述 由 下 列 Bare Bones 语 言 程序 计算 的 函 


数 ， 假 设 该 函数 的 输入 由 x 和 Y 表 示 ， 输 出 由 
2 表示 ; 
clear 2 
Copy X to Auxl 
copy Y to Aux2 
while Auxl not 0: 
while Aux2 not 0: 

decr 2 

decr Aux2 

decr Auxl 


. 写 一 个 Bare Bones 语 言 程序 ， 用 于 计算 变量 X 


和 变量 Y 的 异 或 ， 并 将 结果 存放 在 变量 2 中。 
你 可 以 假设 x 和 Y 只 从 整数 0 和 1 开始 。 


. 如 果 我 们 允许 一 个 Bare Bones 程 序 中 的 指令 


可 以 用 整数 值 标号 , 并 且 把 while 循 环 结构 用 
形 如 
if name not 0: 


goto label; 


的 条 件 转移 指令 代替 ， 其 中 ，name 是 任意 一 
个 变量 ，label 是 一 个 整数 值 ， 用 来 标记 别处 
的 一 条 指令 , 那么 请 证 明 : 这 个 新 语言 仍然 是 
一 种 通用 程序 设计 语言 。 


. 在 本 章 中 ， 我 们 已 经 看 到 ， 语 句 


copy namel to name2 


就 如 何 用 Bare Bones 语 言 来 模拟 的 。 请 证 明 : 
如 果 Bare Bones 语 言 中 的 while 循 环 结构 用 一 
个 形 如 
repeat:... 

until (name equals 0) 


的 后 测试 循环 结构 来 代 蔡 ， 那 么 上 述 语 句 仍 
能 够 被 模拟 。 
证 明 : 如 果 while 语 句 用 一 个 形 如 


18. 


20. 


21. 
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repeat: 


until (name equals 0) 


的 后 测试 循环 结构 来 代替 , Bare Bones 语 言 
为 通用 程序 设计 语言 。 


. 设计 一 个 图 灵机 , 要 求 它 一 旦 启动 , 将 不 会 使 


用 磁带 上 的 一 个 以 上 的 单元 , 而 且 永 不 会 到 达 
停止 状态 。 


. 设计 一 个 图 灵机 , 要 求 将 当前 单元 左边 的 所 


有 单元 置 0， 直 到 遇 到 一 个 包含 星 号 的 单元 
为 止 。 


. 假设 图 灵机 的 磁带 上 0、1 模 式 串 的 两 端 是 用 星 


号 作为 分 界 符 的 , 那么 请 设计 一 个 图 灵机 , 将 
此 模式 左 移 一 个 单元 ， 这 里 假设 机 器 是 从 模式 
右 端的 星 号 处 开始 。 


. 设计 一 个 图 灵机 , 要 求 把 在 当前 单元 ( 它 包 含 


有 一 个 星 号 ) 和 其 左边 的 第 一 个 星 号 之 间 所 发 
现 的 0、1 模 式 串 倒转 。 


. 概述 丘 奇 -图 灵 论 题 。 
. 下 面 的 Bare Bones 语 言 程序 是 自 终 止 的 吗 ? 


请 说 明理 由 。 


COPY XxX to Y 

NG 某 

Eines ¥ 

while X not 0: 
decr 
decr 
decr 


HR ww x 


decr 
decr Y 
while Y not 0: 

incr X 

decr Y 
While X not 0: 


下 面 的 Bare Bones 语 言 程序 是 自 终 止 的 吗 ? 
请 说 明理 由 。 


while X not 0: 


. 下 面 的 Bare Bones 语 言 程 序 是 自 终 止 的 吗 ? 


请 说 明理 由 。 
while X not 0: 


decr X 


分 析 下 面 一 对 命题 的 有 效 性 : 


The next statement is true. 
The previous statement is false. 


分 析 命 题 “ 船 上 的 厨师 为 所 有 人 做 饭 , 但 只 为 
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26. 
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28. 


2 
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那些 自己 不 做 饭 的 人 做 饭 。” 的 有 效 性 。( 提 
示 : 谁 为 厨师 做 饭 ? ) 

假设 你 在 一 个 国家 , 这 个 国家 的 人 要 么 是 说 真 
话 者 ， 要 么 是 说 假 话 者 。( 说 真 话 的 人 一 直 说 
真 话 ， 说 假 话 的 人 一 直 说 假 话 。) 那么 ， 你 怎 
样 向 一 个 人 只 问 一 个 问题 , 就 判断 出 这 个 人 是 
说 真 话 者 ， 还 是 说 假 话 者 。 

请 概括 说 明 , 图 灵机 在 理论 计算 机 科学 领域 里 
的 重要 性 。 

请 概括 说 明 , 停机 问题 在 理论 计算 机 科学 领域 
里 的 重要 性 。 

假设 你 要 在 一 群 人 中 找 出 是 否 有 人 在 某 一 天 
过 生日 。 一 种 方法 就 是 询问 这 群 人 中 的 每 个 成 
员 一 次 。 如 果 你 采用 这 种 方法 , 那么 出 现 何 种 
情况 会 让 你 知道 : 存在 这 样 的 人 ? 出 现 何 种 情 
况 会 让 你 知道 : 不 存在 这 样 的 人 ? 现在 , 假设 
要 找 出 至 少 一 个 具有 某 种 特征 的 正 整数 , 你 可 
以 应 用 同样 的 方法 对 整数 一 次 一 个 地 进行 系 
统 测试 。 事 实 上 ， 如 果 某 个 整数 具有 这 种 特征 ， 
你 会 怎样 将 它 找 出 来 ? 然而 , 如 果 没 有 整数 具 
有 这 样 的 特征 ， 那 你 是 怎样 发 现 的 ? 为 了 确定 
一 个 推测 是 否 为 真 , 是 不 是 必须 得 与 确定 这 个 
推测 是 否 为 假 对 称 地 进行 测试 ? 

在 一 个 列表 中 搜索 遍历 某 个 值 的 问题 属于 多 
项 式 问 题 吗 ? 请 证 明 你 的 答案 。 

设计 一 个 算法 , 确定 一 个 给 定 的 正 整数 是 否 为 
素数 。 你 的 解 是 否 高 效 ? 你 的 解 是 多 项 式 的 还 
是 非 多 项 式 的 ? 

一 个 问题 的 多 项 式 解 是 不 是 一 直 都 比 其 指数 
解 要 好 ? 请 说 明理 由 。 

一 个 问题 有 多 项 式 解 这 样 一 个 事实 , 是 否 就 意 
味 着 它 能 一 直 在 实际 可 行 的 时 间 内 求解 ? 请 
说 明理 由 。 

程序 员 查 理 要 解决 这 样 一 个 问题 ， 将 一 个 组 
(人 数 为 偶数 ) 分 成 人 数 相同 的 两 个 小 组 ， 要 
使 得 每 个 小 组 总 年 龄 间 的 差别 尽 可 能 大 。 他 提 
出 的 解决 方案 是 : 先 构建 出 所 有 可 能 的 小 组 
对 , 计算 每 个 对 总 年 龄 间 的 差别 , 然后 选取 差 
别 最 大 的 那 一 对 。 但 是 , 程序 员 玛 丽 提出 的 解 
决 方案 是 : 首先 将 初始 组 按 年 龄 进行 排序 , 再 
分 成 两 个 小 组 , 年 龄 较 小 的 一 半 为 一 组 , 年 龄 
较 大 的 一 半 为 男 一 组 ,每 种 解决 方案 的 复杂 性 
是 什么 ? 这 个 问题 本 身 是 属于 多 项 式 复杂 性 、 
NP 复 杂 性 还 是 非 多 项 式 复 杂 性 ? 

对 于 列表 的 排序 问题 而 言 ， 可 以 先生 成 列表 
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34. 


的 所 有 排列 ， 然 后 再 选 出 所 需要 的 那 一 种 排 
列 。 那 么 请 问 , 为 什么 这 种 方法 不 是 一 个 令 人 
满意 的 方法 ? 
假设 一 种 彩票 基于 的 是 正确 选择 4 个 整数 值 ， 
每 个 值 的 范围 都 是 1~50。 并 假设 累计 奖金 已 
经 大 到 对 每 种 可 能 的 组 合 分 别 买 一 张 彩票 都 
能 获 利 的 地 步 。 如 果 买 一 张 彩票 要 花 一 秒 钟 
的 时 间 ， 那 么 为 每 种 可 能 的 组 合 都 买 一 张 彩 
票 得 花 多 长 时 间 ? 如 果 彩 票 需要 选取 5 个 数 ， 
而 不 是 4 个 数 , 那么 所 需 时 间 将 如 何 变化 ? 依 
据 本 章 所 讨论 的 内 容 ， 这 个 问题 必须 要 做 些 
什么 ? 
下 面 的 算法 是 确定 性 的 吗 ? 请 说 明理 由 。 
def mystery (Number): 
if (Number > 5): 
回答 "yes" 
else: 

挑 一 个 比 5 小 的 数 并 将 这 个 数 作为 答案 
下 面 的 算法 是 确定 性 的 吗 ? 请 说 明理 由 。 
一 直 向 前 开 。 
在 第 三 个 十 字 路 口 , 问 站 在 拐角 处 的 人 你 应 该 往 右 


转 还 是 应 该 往 左 转 。 


35., 


36. 
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38. 


根据 那个 人 指 的 方向 转弯 。 

开 两 个 区 ， 然 后 停 下 来 。 

请 确定 下 列 算法 中 非 确 定 的 地 方 : 

从 1~100 之 间 选 3 个 数 。 

if (如 果 所 选 数字 之 和 大 于 150) : 
回答 "yes" 

else: 


选择 已 选 出 的 数 中 的 一 个 ， 将 该 数 作为 答案 


下 列 算法 是 具有 多 项 式 时 间 复 杂 性 还 是 具有 
非 多 项 式 时 间 复 杂 性 ? 请 说 明理 由 。 
def mystery (ListOfNumbers): 
从 ListofNumbers 中 选 一 组 数 。 
if (这 些 数 加 起 来 得 125) : 
回答 "yes" 
else: 
不 给 出 答案 
以 下 问题 中 ， 哪 些 问题 是 属于 P 类 的 ? 
a. 复杂 性 为 到 的 问题 
b. 复杂 性 为 3n 的 问题 
c. 复杂 性 为 w+2n 的 问题 
d. 复杂 性 为 n! 的 问题 
概述 声明 一 个 问题 是 多 项 式 问题 和 声明 一 个 
问题 是 非 确 定性 多 项 式 问 题 之 间 的 区 别 。 
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39. 请 举 出 一 个 问题 的 例子 ， 要 求 该 问题 既 属 于 P 请 找 出 和 为 1723 的 数据 项 。 你 用 的 是 什么 算 
类 ， 又 属于 NP 类 。 法 ? 其 复杂 性 又 如 何 ? 
40. 假设 给 你 两 个 算法 用 来 解决 同一 个 问题 ,一 个 46. 请 指出 旅行 商 问题 与 背包 问题 的 相似 之 处 ( 见 
” 算法 的 时 间 复 杂 性 为 zi, 而 另 一 个 算法 的 时 间 第 45 题 )。 
复杂 性 为 4n, 那么 在 什么 样 规模 的 输入 上 前 者 47. 下 面 的 列表 排序 算法 称 为 冒 泡 排 序 。 当 将 其 用 
比 后 者 更 为 有 效 ? 到 一 个 有 n 个 数据 项 的 列表 中 时 ， 冒 泡 排 序 需 
41. 假设 要 解决 的 问题 是 旅行 商 问题 , 其 中 所 涉及 要 在 列表 项 中 进行 多 少 次 比较 ? 
的 城市 数 为 15, 而 任意 两 个 城市 之 间 只 有 一 条 das Dubblesene (Listy: 
路 相连 。 那么 请 问 , 遍历 这 些 城市 共有 多 少 种 Counter =1 
不 同 的 路 径 ? 这 里 假设 每 条 路 径 的 长 度 能 够 while (Counter < List 中 的 项 的 个 数 ) : 
在 1 微 秒 内 计算 出 来 ， 那 么 计算 出 所 有 这 些 路 N = List 中 的 项 的 个 数 
径 的 长 度 要 花 多 长 时 间 ? 人 
42. 如 果 将 归并 排序 算法 〈 见 图 12-15 和 图 12-14) if (List 中 的 第 N 个 项 小 于 其 前 面 的 项 ) : 


第 N 个 项 和 前 面 的 一 项 交换 
N = N-1 


用 RSA 公 钥 加 密 技 术 对 报 文 110 进 行 加 密 ， 这 


应 用 到 列表 Alice、Bob、Carol 以 及 David， 那 
么 要 做 多 少 次 名 字 比 较 ? 如 果 应 用 到 列表 
Alice、Bob、Carol、David 以 及 Elaine， 那 么 又 48. 


Co 


将 做 多 少 次 名 字 比 较 ? 里 公 钥 为 n=91 和 e=5。 

43. 请 为 图 12-18 所 示 的 每 一 类 问题 都 举 出 一 个 49. 用 RSA 公 钥 加 密 技术 对 报 文 111 进 行 解密 ， 这 
例子 。 里 私 钥 为 n=133 和 d=5。 

44. 设计 一 个 算法 ， 找 到 形 如 x? + 六 =n 的 等 式 的 50. 假设 你 知道 一 个 基于 RSA 算 法 的 公 钥 加 密 系 
整数 解 ， 这 里 ，n 是 某 个 给 定 的 正 整 数 。 确 定 统 ， 其 公 钥 为 n = 77 和 e =7。 私 钥 是 什么 ? 怎 
你 的 算法 的 时 间 复 杂 性 。 样 才 能 让 你 在 一 个 合理 的 时 间 范 围 内 解决 这 

45. 背包 问题 (knapsack problem) 是 另 一 个 属于 个 问题 ? 
NP 完全 类 的 问题 。 该 问题 由 在 从 一 个 列表 中 51. 找 出 107 531 的 因数 。 这 个 问题 与 本 章 的 内 容 
找 出 一 些 数 ， 使 得 这 些 数 的 和 等 于 某 个 值 。 有 什么 关联 ? 
例如 ， 列 表 52. 如 果 正 整数 n 在 2 一 Vn 范围 内 没有 整数 因子 , 那么 
1 我 们 能 够 得 出 什么 结论 ? 对 于 找 一 个 正 整数 的 因 

子 这 样 的 任务 来 说 ， 这 又 能 告诉 你 一 些 什 么 ? 

中 的 数据 项 257、388 和 782, 它们 的 和 为 1 427。 

社会 问题 





希望 下 面 的 问题 能 引导 读者 思考 一 些 与 计算 领域 相关 的 道德 、 社 会 和 法 律 问 题 。 回 答 出 这 
些 问 题 还 不 够 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

1. 假设 求解 一 个 问题 的 最 优 算法 需要 执行 100 年 ， 那 么 你 会 认为 这 个 问题 是 容易 处 理 的 
吗 ? 为 什么 ? 

2. 公民 有 权 在 免 受 政 府 部 门 监控 的 情况 下 对 报 文 进行 加 密 吗 ? 你 的 回答 是 否 考虑 到 了 “ 合 
适 的 ”法 律 执行 ? 那么 谁 来 决定 “合适 的 ”法 律 执行 是 什么 ? 

3. 如 果 人 脑 是 一 个 算法 设备 ， 那 么 关于 人 性 ， 图 灵 论 题 会 有 什么 结果 ? 在 何 种 程度 上 你 会 
认为 图 灵机 包含 了 人 脑 的 计算 能 力 ? 

4. 我 们 已 经 看 到 ,不 同 的 计算 模型 (如 有 限 表 、 代 数 公 式 、 图 灵机 等 ) 有 不 同 的 计算 能 力 。 
不 同 的 生物 体 也 有 不 同 的 计算 能 力 吗 ? 不 同 的 人 的 计算 能 力也 不 同 吗 ? 如 果 是 这 样 , 那 
么 具有 较 高 能 力 的 人 是 否 能 用 这 些 能 力 来 获得 更 好 的 生活 方式 ? 

5. 在 今天 ， 有 许多 网 站 提供 了 大 多 数 城市 的 道路 图 。 这些 站 点 能 够 帮助 寻找 某 个 具体 的 地 
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址 ， 并 提供 放大 功能 来 看 清 小 范围 的 街区 布局 。 从 这 个 事实 出 发 ， 考 虑 下 面 一 系列 的 假 
想 。 假设 这 些 地 图 站 点 配备 了 有 具有 缩放 功能 的 卫星 像 片 。 假 设 这 些 缩放 功能 被 增强 到 能 
对 某 个 独立 的 建筑 及 其 周边 的 景象 给 出 更 为 详细 的 图 像 。 假设 这 些 图 像 又 增强 到 包括 实 
时 视频 。 假 设 这 些 实时 视频 图 像 通过 使 用 红外 线 技术 而 得 到 加 强 。 到 了 这 个 地 步 ， 别 人 
就 能 够 一 天 24 小 时 地 监视 你 的 家 。 在 这 一 系列 技术 进步 中 ， 你 的 隐私 权 是 在 哪 一 点 开始 
受到 侵犯 的 ? 在 这 一 系列 技术 进步 中 ,你 认为 什么 事情 上 我 们 的 做 法 超越 了 当今 间谍 卫 
星 技 术 的 能 力 ? 在 怎样 的 程度 上 ， 这 个 场景 就 只 是 假想 的 ? 

6. 假设 一 个 公司 开发 了 一 个 加 密 系统 ， 并 取得 了 专利 权 。 该 公司 所 在 国家 的 政府 机 构 是 否 
有 权 以 国家 安全 的 名 义 来 使 用 这 个 系统 ? 该 公司 所 在 国家 的 政府 机 构 是 否 有 权 以 国家 
安全 的 名 义 限制 这 个 公司 对 这 个 系统 的 商业 使 用 ? 如 果 这 个 公司 是 跨国 公司 ,那么 情况 
又 会 怎样 ? 

7. 假设 你 买 了 一 个 产品 ， 其 内 部 结构 是 加 密 的 ， 那么 你 是 否 有 权 对 这 个 产品 的 基本 结构 进 
行 解密 ? 如 果 是 , 你 是 否 有 权 以 商业 方式 来 使 用 这 些 信息 ?以 非 商业 方式 使 用 呢 ? 如 果 
它 的 加 密 是 利用 一 个 秘密 的 加 密 系统 来 实现 的 ， 而 你 发 现 了 这 个 秘密 ， 那 么 你 有 权 分 享 
这 个 秘密 吗 ? 

8. 很 多 年 以 前 ， 哲 学 家 约翰 。 杜 威 〈1859 一 1952) 提出 了 “有 履 责 技术 ”(responsible technology ) 
这 个 术语 。 请 举 出 一 些 例子 ， 说 明 你 对 “有 履 责 技术 ”是 怎样 理解 的 。 在 例子 的 基础 上 ， 阐 
明 你 自己 对 “有 履 责 技术 ”的 定义 。 在 过 去 的 100 多 年 里 ， 社 会 实践 了 “有 履 责 技术 ” 吗 ? 应 
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ASCII 码 


面 列 出 了 ASCI 码 的 一 部 分 ， 并 在 每 个 位 模式 的 左边 都 添加 了 一 个 0， 以 构成 现在 通 
用 的 8 位 位 模式 。 第 3 列 是 每 个 8 位 位 模式 对 应 的 十 六 进 制 值 。 





DO 和 人 了 宁 和 区 有 一 巴 一 


ASCII 十 六 进 制 值 符号 ASCII 十 六 进 制 值 ” 符号 ASCII 十 六 进 制 值 
00001010 0A > 00111110 3E ^ 01011110 5E 
00001011 0B ? 00111111 3F 01011111 SF 
00100000 20 @ 01000000 40 01100000 60 
00100001 21 A 01000001 41 a 01100001 61 
00100010 观 B 01000010 42 b 01100010 62 
00100011 23 € 01000011 43 c 01100011 63 
00100100 24 D 01000100 44 d 01100100 64 
00100101 25 E 01000101 45 e 01100101 65 
00100110 26 F 01000110 46 f 01100110 66 
00100111 3 G 01000111 47 g 01100111 67 
00101000 28 H 01001000 48 h 01101000 68 
00101001 29 I 01001001 49 i 01101001 69 
00101010 2A J 01001010 4A j 01101010 6A 
00101011 2B K 01001011 4B k 01101011 6B 
00101100 2 人 01001100 4C 1 01101100 6C 
00101101 2D M 01001101 4D m 01101101 6D 
00101110 2E N 01001110 4E n 01101110 6E 
00101111 2F O 01001111 4F 0 01101111 6F 
00110000 30 P 01010000 50 p 01110000 70 
00110001 31 Q 01010001 51 q 01110001 71 
00110010 32 R 01010010 52 r 01110010 72 
00110011 33 S 01010011 53 s 01110011 73 
00110100 34 . 01010100 54 t 01110100 74 
00110101 35 U 01010101 55 u 01110101 75 
00110110 36 V 01010110 56 V 01110110 76 
00110111 37 W 01010111 57 Ww 01110111 77 
00111000 38 法 01011000 58 x 01111000 78 
00111001 39 Y 01011001 59 y 01111001 79 
00111010 3A Z 01011010 5A Z 01111010 7A 
00111011 3B [ 01011011 5B { 01111011 7B 
00111100 3C \ 01011100 SC | 01111100 7C 
00111101 3D ] 01011101 5D } 01111101 7D 


maB 
用 于 处 理 二 进 制 补 码 表 示 的 电路 


附录 介绍 用 电路 实现 对 二 进 制 补 码 表示 的 值 进行 取 负 及 相 加 操作 。 我 们 从 图 B-1 的 

电路 开始 ， 它 将 一 个 4 位 的 二 进 制 补 码 表示 转换 为 该 值 的 负 值 的 表示 。 例 如 ， 假 设 
给 出 3 的 二 进 制 补 码 表示 ， 则 该 电路 产生 -3 的 表示 。 算 法 与 正文 中 所 述 一 样 。 也 就 是 说 ， 它 自 右 
向 左 复制 位 模式 ， 直 至 复制 到 一 个 1， 然 后 当 它 从 输入 向 输出 移动 时 ， 求 剩余 各 位 的 补 码 。 由 于 
最 右边 XOR 门 的 一 个 输入 值 固定 为 0， 所 以 此 门 只 能 将 其 另 一 个 输入 传送 至 输出 。 然 而 这 个 输 
出 又 向 左 传 给 下 一 个 XOR 门 作为 一 个 输入 。 如 果 这 个 输出 是 1， 那 么 下 一 个 XOR 门 将 会 把 其 输 
入 位 取 反 后 送 给 输出 。 而 且 ， 这 个 1 还 会 通过 OR 门 向 左 传送 ， 影 响 下 一 个 门 。 就 这 样 ， 复 制 给 
输出 的 第 一 个 1 也 会 向 左 传送 ， 使 得 所 有 剩余 的 位 在 送 到 输出 时 都 取 反 。 


输入 


输出 
图 B-1 将 一 个 二 进 制 补 码 位 模式 取 负 的 电路 
接 下 来 ， 我 们 考虑 一 下 用 二 进 制 补 码 表示 的 两 个 数值 的 加 法 。 具 体 而 言 ， 解 决 问题 


+ 0110 

+ 1011 
时 ， 我 们 是 从 右 至 左 一 列 一 列 地 计算 并且 每 列 都 执行 相同 的 算法 。 因 此 ， 只 要 获得 这 类 问题 
一 列 的 加 法 电路 ， 通 过 重复 这 个 单列 电路 ， 就 可 以 构建 许多 列 的 相 加 电路 。 

多 列 加 法 问题 中 一 个 单列 的 相 加 算法 是 这 样 的 : 把 当前 列 的 两 个 数值 相 加 ， 把 相 加 的 和 加 
上 上 一 列 的 进位 ， 并 将 此 和 的 最 低 有 效 位 记 为 答案 , 然后 将 进位 传 向 下 一 列 。 图 B-2 中 的 电路 遵 
循 的 就 是 这 个 算法 。 上 面 的 XOR 门 决定 了 两 个 输入 位 的 和 。 下 面 的 XOR 门 将 这 个 和 与 上 一 列 
的 进位 相 加 。 两 个 AND 门 及 OR 门 一 起 把 进位 向 左 传送 。 具 体 来 说 ， 如 果 该 列 中 最 初 的 两 个 输 
入 是 1， 或 者 这 些 位 的 和 及 进位 都 是 1， 那 么 就 会 产生 一 个 进位 1。 

图 B-3 表 示 单 列 电路 的 副本 如 何 用 于 产生 计算 用 4 位 二 进 制 补 码 系统 表示 的 两 个 值 和 的 电 
路 。 图 中 每 个 矩形 表示 单列 加 法 电路 的 一 个 副本 。 需 要 注意 的 是 : 最 右边 矩形 的 进位 值 总 是 0， 
因为 它 没有 来 自 上 一 列 的 进位 。 以 此 类 推 ， 最 左边 矩形 产生 的 进位 将 被 忽略 。 





附录 也 用 于 处 理 二 进 制 补 码 表示 的 电路 


列 的 上 列 的 下 
面 一 位 面 一 位 


向 下 一 
列 进位 来 自 上 一 
列 的 进位 
和 
图 B-2 在 一 个 多 列 加 法 问题 中 进行 单列 相 加 的 电路 
上 面 的 输入 下 面 的 输入 





和 
图 B-3 ”使 用 图 B-2 中 电路 的 4 个 副本 将 2 个 二 进 制 补 码 表示 的 数值 相 加 的 电路 
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因为 进位 的 信息 自 最 右 列 向 最 左 列传 播 , 或 者 说 波动 , 所 以 图 B-3 中 的 电路 称 为 行 波 进位 加 
法 器 (ripple adder)。 这 类 电路 尽管 结构 简单 ， 但 执行 速度 较 慢 ， 而 一 些 更 好 的 电路 ， 例 如 ， 先 
行进 位 加 法 器 ,就 可 以 将 这 种 列 到 列 的 传播 减 到 最 小 。 于是， 尽管 图 B-3 中 的 电路 足够 满足 我 们 


的 要 求 ， 但 并 不 是 当今 机 器 中 使 用 的 电路 。 


出 录 人 
一 种 简单 的 机 器 语言 


附录 介绍 一 种 简单 却 有 代表 性 的 机 器 语言 。 我 们 首先 解释 一 下 这 一 机 器 本 身 的 体系 
结构 。 


C.1 机 器 体系 结构 。 


这 种 机 器 有 16 个 通用 寄存 器 ,编号 为 0~~F (十 六 进 制 表示 )。 每 个 寄存 器 的 长 度 为 1 字 节 (8 
位 )。 为 了 在 指令 中 标识 寄存 器 ， 每 个 寄存 器 被 赋予 了 唯一 的 4 位 模式 ， 用 于 代表 其 寄存 器 号 。 
于 是 ， 寄 存 器 0 由 0000〈 十 六 进 制 0) 标识 ， 寄 存 器 4 由 0100《〔〈 十 六 进 制 4) 标识 。 

机 器 主 存 中 有 256 个 单元 ， 每 个 单元 被 赋予 一 个 范围 为 0 一 255 的 整数 地 址 。 因 此 ， 一 个 地 址 
可 以 由 00000000~11111111 〈 或 者 是 十 六 进 制 值 的 00 一 FF) 的 一 个 8 位 模式 来 表示 。 

假设 浮 点 值 以 1.7 节 讨论 过 并 且 概 括 在 图 1-24 中 的 8 位 格式 存储 。 














C.2 机 器 语言 


每 条 机 器 指令 都 是 2 字 节 长 :前 面 的 4 位 是 操作 码 ， 后 面 的 12 位 组 成 操作 数字 段 。 下 面 的 表 
格 列 出 了 用 十 六 进 制 记 数 法 表示 的 指令 及 简要 说 明 。 字 母 R、S 及 T 在 表示 寄存 器 标识 符 的 那些 
字段 处 用 来 蔡 代 十 六 进 制 数字 , 并且 因 指令 的 具体 应 用 而 异 。 字母 X 及 Y 用 来 在 变量 字段 替代 十 
六 进 制 数字 ， 而 不 是 代表 寄存 器 。 





tr 





oe sr emer mt terre iso 





操 作 码 操 作 数 说 明 
1 RXY 在 地 址 为 XY 的 存储 单元 中 找到 的 位 模式 加 载 (LOAD) 寄存 器 R 
例 : 14A3 将 使 得 地 址 为 A3 的 存储 单元 的 内 容 放 入 寄存 器 4 
2 RXY 以 位 模式 XY 加 载 (LOAD) 寄存 器 R 
例 : 20A3 将 使 得 值 A3 放 入 寄存 器 0 
3 RXY 将 寄存 器 R 中 的 位 模式 存储 (STORE) 在 地 址 为 XY 的 存储 单元 中 
例 : 35B1 将 使 得 寄存 器 5 中 的 内 容 放 入 地 址 为 Bl1 的 存储 单元 
4 ORS 将 寄存 器 R 中 的 位 模式 移入 (MOVE) 寄存 器 S 
例 : 40A4 将 使 得 寄存 器 A 的 内 容 复制 到 寄存 器 4 
5 RST 将 寄存 器 S 及 寄存 器 T 的 位 模式 作为 二 进 制 补 码 表示 相 加 (ADD)， 将 求 
和 结果 存放 在 寄存 器 R 中 
例 : 5726 将 使 得 寄存 器 2 和 寄存 器 6 中 的 二 进 制 数值 相 加 ， 并 将 和 存放 在 
寄存 器 7 中 
6 RST 将 寄存 器 S 及 寄存 器 IT 的 位 模式 作为 浮 点 表示 值 相 加 (ADD)， 并 将 浮 点 
结果 存放 在 寄存 器 R 中 


例 : 634E 将 使 得 寄存 器 4 和 寄存 器 E 中 的 浮 点 值 相 加 ， 并 将 结果 存放 在 寄 
存 器 3 中 


RST 


ROX 


000 


说 明 


将 寄存 器 $ 及 寄存 器 T 中 的 位 模式 做 或 (OR) 操作， 并 将 结果 存放 在 寄存 
器 R 中 

例 : 7CB4 将 使 得 寄存 器 B 和 寄存 器 4 的 内 容 做 或 操作 的 结果 存放 在 寄存 
器 C 中 

将 寄存 器 S 及 寄存 器 T 中 的 位 模式 做 与 AND) 操作 ， 并 将 结果 存放 在 寄 
存 器 R 中 

例 : 8045 将 使 得 寄存 器 4 和 寄存 器 5 的 内 容 做 与 操作 的 结果 存放 在 寄存 
器 0 中 

将 寄存 器 S 和 寄存 器 T 中 的 位 模式 进行 异 或 (EXCLUSIVE OR) 操作 ， 并 
将 结果 存放 在 寄存 器 R 中 

例 : 95F3 将 使 得 寄存 器 FE 和 寄存 器 3 的 内 容 进 行 异 或 操作 的 结果 存放 在 寄 
存 器 5 中 

将 寄存 器 R 中 的 位 模式 循环 (ROTATE) 右 移 一 位 ， 进 行 X 次 。 每 次 都 把 
从 低位 端 开始 的 那个 位 放 入 高 端 

例 : A403 将 使 得 寄存 器 4 中 的 内 容 循 环 右 移 3 位 

如 果 寄 存 器 R 中 的 位 模式 等 于 寄存 器 0 中 的 位 模式 ， 那 么 转移 (JUMP) 到 
地 址 XY 处 的 存储 单元 中 的 指令 ; 否则 ,继续 正常 的 执行 顺序 (转移 是 通过 
在 执行 周期 将 XY 复制 到 程序 计数 器 来 实现 的 ) 

例 : B43C 将 首先 比较 寄存 器 4 和 寄存 器 0 中 的 内 容 。 如 果 二 者 相等 ， 则 把 
模式 3C 放 入 程序 计数 器 ， 所 以 下 一 条 执行 的 指令 将 是 这 个 存储 地 址 中 的 那 
条 ; 否则 ， 不 做 任何 事情 ， 程 序 将 照常 继续 

停止 (HALT) 执行 





高 级 程序 设计 语言 
本 附录 包 售 了 在 第 6 音 中 作为 例子 使 用 的 每 种 语言 的 简要 背景 。 
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D.1 Ada 





Ada 语 言 是 根据 奥 古 斯 塔 。 艾 达 。 拜 伦 (Augusta Ada Byron) (1815 一 1851) 命名 的 。 她 是 
查尔斯 . 巴 贝 奇 Charles Babbage〉 的 拥护 者 ， 诗 人 拜 伦 勋 玫 (Lord Byron) 的 女儿 。 这 个 语言 
最 初 是 由 美国 国防 部 开发 的 , 目的 是 为 了 得 到 一 种 满足 其 所 有 软件 开发 需要 的 通用 语言 。 在 Ada 
的 设计 期 间 ， 一 个 重点 是 加 入 实时 计算 机 系统 程序 设计 的 特性 ， 这 类 系统 常用 来 作为 更 大 型 机 
器 的 一 部 分 , 如 导弹 制导 系统 、 楼 际 间 的 环境 控制 系统 以 及 汽车 和 小 型 家 用 电器 中 的 控制 系统 。 
因此 ，Ada 语 言 包含 这 样 一 些 特征 : 既 可 以 表达 并 行 处 理 环境 中 的 活动 ， 又 可 以 作为 合适 的 技 
术 解 决 在 应 用 环境 中 出 现 的 特殊 情况 〈 称 为 异常 )。 尽 管 初期 是 作为 命令 式 语言 设计 的 ， 但 Ada 
的 新 版 本 中 包含 了 面向 对 象 范 型 。 

Ada 语 言 的 设计 一 贯 强调 可 实现 可 靠 软件 高 效 开 发 的 特性 ， 下 面 这 个 事实 例证 了 这 个 特性 : 
波音 777 飞 机 中 所 有 内 部 的 控制 软件 都 是 用 Ada 语 言 编写 的 , 这 也 是 Ada 用 作 SPARK 语 言 开 发 ( 正 
如 第 5 章 中 说 明 的 ) 的 起 始点 的 主要 原因 。 


D2 心 








C 语 言 是 由 贝尔 实验 室 的 丹尼斯 。 里 奇 (Dennis Ritchie) 于 20 世 纪 70 年 代 初 期 开发 的 。 尽 
管 它 最 初 是 作为 开发 系统 软件 的 语言 来 设计 的 ， 但 却 在 程序 设计 界 颇 为 流行 ， 并 且 已 经 被 美国 
国家 标准 协会 标准 化 。 

C 语 言 最 初 的 设想 只 是 跨 出 机 器 语言 的 一 步 而 已 。 所 以 与 使 用 完整 的 英语 词汇 的 其 他 
高 级 语言 相 比 ， 它 的 语法 十 分 简洁 ， 原 语 都 用 专门 符号 表示 。 它 的 这 种 简练 性 可 有 效 地 表 
示 复 杂 算 法 ， 这 也 是 其 广 为 流 行 的 一 个 主要 原因 。( 通 常 说 来 ， 简 洁 的 表示 比 宛 长 的 表达 更 
易 读 。) 


D3 Gt 





C++ 语言 是 贝尔 实验 室 的 本 贾 尼 。 斯 特 劳 斯 特 卢 普 〈(Bjarne Stroustrup) 作为 C 语 言 的 一 个 增 
强 版 本 开发 的 。 目 的 是 开发 一 种 可 以 与 面向 对 象 范 型 相 兼容 的 语言 。 当 今 ，C++ 赁 其 自身 的 实 
力 已 经 成 为 著名 的 面向 对 象 语言 ， 同 时 它 还 作为 另外 两 种 主流 面向 对 象 语言 (Java 和 C#) 开发 
的 起 始点 。 


D.6 Java 411 





C# 语 言 是 由 微软 公司 开发 的 .NET 框 架 中 的 工具 , 它 是 为 运行 微软 系统 软件 的 机 器 开发 应 用 
软件 的 一 个 综合 系统 。C# 语 言 看 起 来 很 像 C++ 或 Java。 事 实 上 ， 微 软 公司 将 C# 作 为 一 种 不 同 的 
语言 来 推介 并 不 是 因为 它 是 一 种 全 新 的 语言 ， 而 是 因为 它 可 以 根据 自己 的 需要 定制 语言 的 一 些 
专门 特性 ， 而 不 必 考 虑 与 其 他 语言 相关 的 标准 ， 也 不 需要 考虑 其 他 公司 的 专利 权 问题 。 因 此 ， 
C# 的 创新 性 在 于 : 在 利用 .NET 框 架 开 发 软件 方面 ， 它 的 作用 非常 突出 。 拥 有 微软 公司 的 支持 ， 
在 未 来 的 几 年 里 ，C# 以 及 .NET 框 架 一 定 能 够 成 为 软件 开发 界 的 佼佼 者 。 


D.5 FORTRAN 





FORTRAN 是 FORmula TRANslator (公式 翻译 语言 的 简写 。 该 语言 是 第 一 批 开发 的 高 级 
语言 之 一 (公布 于 1957 年 )， 并 且 是 在 计算 界 中 最 先 获得 广泛 认同 的 语言 之 一 。 多 年 以 来 ， 它 的 
官方 描述 经 历 了 许多 次 的 扩充 ， 也 就 是 说 ， 今 天 的 FORTRAN 语 言 与 原始 的 版 本 有 很 大 的 不 同 。 
事实 上 , 通过 学 习 FORTRAN 语 言 的 演变 ， 人们 能 见证 研究 对 程序 语言 设计 产生 的 影响 。 尽 管 最 
初 是 设计 成 一 种 指令 语言 ， 但 FORTRAN 的 新 版 本 现在 已 经 包含 了 许多 面向 对 象 特 性 。 
FORTRAN 语 言 在 科学 界 仍然 是 一 种 很 流行 的 语言 。 有 具体 来 说 , 许多 数值 分 析 以 及 统计 软件 包 都 
是 使 用 FORTRAN 语 言 编 写 的 ， 而 且 仍 将 继续 用 FORTRAN 语 言 编写 。 


ent 


D.6 Java 





Java 是 Sun Microsystems 公 司 在 20 世 纪 90 年 代 早 期 开发 的 一 种 面向 对 象 语言 。 该 语言 的 设计 
者 在 很 大 程度 上 借 了 C 语 言 以 及 C++ 语言 的 特性 。Java 带 来 的 振奋 不 是 由 于 语言 本 身 ， 而 是 由 于 
该 语言 的 通用 实现 性 以 及 在 Java 编 程 环境 中 大 量 预先 设计 好 的 模板 。 通 用 实现 性 指 的 是 用 Java 
语言 编写 的 程序 能 够 在 很 多 机 器 上 有 效 地 执行 ;模板 的 可 用 性 意味 着 复杂 软件 能 相对 比较 容 
易 地 开发 出 来 。 例 如 ，applet (小 应 用 程序 ) 及 servlet (小 服务 程序 ) 等 模板 使 得 万 维 网 软件 的 
开发 更 加 流畅 。 





迭代 结构 与 递归 结构 的 等 价 性 


本 附录 中 , 我 们 使 用 第 12 章 中 的 Bare Bones 语 言 作为 工具 来 回答 第 5 章 中 提出 的 关于 

士 达 代 结构 与 递归 结构 就 更 强大 的 问题 。 回想 一 下 : Bare Bones 语 言 只 包含 3 个 赋值 语 

名 (clear、incr 以 及 decr) 和 一 个 控制 结构 (由 while 语 句 构 成 )。 并 且 这 种 简单 的 语言 与 

图 灵机 具有 相同 的 计算 能 力 ; 因此 ， 如 果 我 们 接受 了 丘 奇 -图 灵 论 题 ， 就 可 以 得 出 结论 : 任何 具 
有 算法 解 的 问题 都 有 可 用 Bare Bones 表 达 的 解 。 

迭代 结构 与 递归 结构 进行 比较 的 第 一 步 是 将 Bare Bones 语 言 的 迭代 结构 替换 成 递归 结构 。 

方法 如 下 : 将 while 语 句 从 该 语言 中 移出 ,并 在 它 的 位 置 提供 可 以 把 Bare Bones 程 序 分 成 部 分 单 

元 的 能 力 ， 以 及 可 从 程序 其 他 地 方 调用 这 些 单元 之 一 的 能 力 。 严 格 地 说 ， 我 们 建议 用 修改 后 的 

语言 编写 的 每 个 程序 由 许多 语法 上 分 离 的 程序 单元 构成 。 假 定 每 个 程序 必须 正好 包含 一 个 称 为 

MAIN 的 单元 ， 它 的 语法 结构 如 下 : 


def MAIN () : 





《其 中 点 表示 其 他 缩 进 的 Bare Bones 语 句 ) 也 可 能 包括 具有 以 下 结构 的 其 他 单元 (语法 上 从 属于 
MAIN): 


def unit(): 


(unit 表示 单元 的 名 称 , 与 变量 名 具有 相同 的 语法 。) 这 种 分 割 结构 的 语义 是 : 程序 总 是 从 MAIN 
单元 的 开头 开始 执行 ， 并 且 在 该 单元 的 缩 进 部 分 执行 完成 时 停止 。 除 了 MAIN 之 外 的 程序 单元 都 
可 以 通过 条 件 语句 
if name not 0: 
人 | 


作为 函数 来 调用 (其 中 name 表 示 任 何 变量 名 ,unit 表示 除了 MAIN 之 外 的 其 他 任何 程序 单元 名 )。 
而 且 ， 还 允许 MAIN 单 元 之 外 的 其 他 单元 递归 地 调用 自己 。 

有 了 这 些 附加 的 特性 ， 我 们 就 可 以 模拟 原来 Bare Bones 中 的 while 结 构 了 。 例 如 ， 一 个 如 下 
形式 的 Bare Bones 程 序 : 

while X not 0: 


S 


(其 中 s 表 示 任 何 Bare Bones 语 句 的 序列 )， 它 可 以 被 如 下 单元 结构 替代 : 
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def MRIN () : 
if X not 0: 
unitA() 
def unitRA() : 
S 
df 其 Bet OE 
unitA() 


因此 ， 我 们 得 出 结论 : 修改 后 的 语言 具有 原始 Bare Bones 语 言 的 所 有 能 力 。 

也 可 以 说 明 ， 任 何 能 使 用 修改 后 语言 解决 的 问题 都 能 够 用 Bare Bones 来 解决 。 做 到 这 一 点 
的 一 种 方法 就 是 ， 说 明 任何 用 修改 后 语言 表达 的 算法 都 可 以 用 原始 的 Bare Bones 语 言 编写 。 不 
过 ， 这 涉及 “递归 结构 如 何 用 Bare Bones 语 言 的 while 结 构 来 模拟 ”的 一 个 精确 的 描述 。 

对 于 我 们 的 目的 ， 比 较 简 单 的 就 是 根据 第 12 章 所 介绍 的 丘 奇 -图 灵 论 题 。 具 体 来 说 ， 丘 奇 - 
图 灵 论 题 ， 加 上 Bare Bones 与 图 灵机 具有 相同 的 能 力 这 个 事实 ， 表明 了 没有 比 原始 Bare Bones 更 
强大 的 语言 了 。 所 以 ， 任 何 可 以 用 我 们 修改 后 的 语言 求解 的 问题 也 能 用 Bare Bones 解 决 。 

我 们 得 出 的 结论 是 ， 修 改 后 语言 的 能 力 与 原始 Bare Bones 的 能 力 一 样 。 两 种 语言 之 间 的 唯 
一 区 别 是 : 一 种 提供 的 是 迭代 控制 结构 ， 而 另外 一 种 提供 的 是 递归 控制 结构 。 因 此 ， 实 际 上 这 
两 种 控制 结构 在 计算 能 力 上 是 等 价 的 。 
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州 太 学 伯克利 分 校 等 著名 大 学 的 首选 教材 ， 对 我 国 的 高 



































本 书 以 历史 的 眼光 ， 从 发 展 的 角度 、 当 前 的 水 平 以 及 现 阶段 的 研究 方向 等 几 个 方面 ， 全 景 3 
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第 12 版 主要 是 将 Python 程序 设计 语言 方面 的 介绍 纳入 了 重点 章节 。 此 外 ， 几 乎 每 一 章 都 能 看 到 
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